Have a nice day
Measure for you. You like it
<>
<>
Sorry, wenn's jetzt lnger wird. Und es wird jetzt verdammt lang. Denn mit dem Thema Alt-Texte und Bildbeschreibungen im Fediverse befasse ich mich schon seit Jahren entsprechend habe ich viel dazu zu sagen.
Ein Problem, das viele mit Alt-Texten haben, ist, da sie wie gefhlt 95% der Mastodon-Nutzer immer nur am Smartphone sind. Alt-Texte knnen sie nur auf dem Touchscreen eingeben. Zum einen ist das fummelig, zum anderen knnen sie whrenddessen das Bild nicht sehen, das sie beschreiben.
Was die Alt-Text-Polizei angeht: Das bezeichnet ja nicht nur Leute, die einfach nur versuchen, andere dazu zu bringen, Alt-Texte zu schreiben. Eine tun tatschlich nur das. Andere aber versuchen, gewisse Mindeststandards im Fediverse durchzusetzen.
Es reicht einfach nicht mehr, da es berhaupt Alt-Texte gibt. Bildbeschreibungen mssen absolut akkurat und korrekt sein, sie mssen einen Mindestdetailgrad haben, Texte mssen exakt Zeichen fr Zeichen transkribiert werden usw.
Allerdings spricht sich die Alt-Text-Polizei nicht untereinander ab. Das kann sie gar nicht, weil es dafr Diskussionsgruppen bruchte, die Alt-Text-Polizei ausschlielich auf Mastodon ist und Mastodon nicht nur keine Gruppen hat, sondern auch annhernd null Untersttzung fr schon existierende Gruppen woanders im Fediverse. Die allermeisten Mastodon-Nutzer wissen ja nicht mal, da das Fediverse berhaupt Gruppen hat, weil eben Mastodon keine hat.
Und mit blinden oder sehbehinderten Nutzern sprechen die sich auch nicht ab, so da sie gar nicht wissen, was diese Nutzer wirklich wollen. So hat jeder seine eigenen Mindeststandards, die hufig ber die Anforderungen der tatschlichen Zielgruppen von Alt-Texten hinausgehen. Man begreift die aber jeweils als den alleingltigen Goldstandard und wei auch nicht, da andere bei der Alt-Text-Polizei Standards haben, die den eigenen widersprechen.
So gibt es dann Leute bei der Alt-Text-Polizei, denen es reicht, wenn es berhaupt einigermaen brauchbare Alt-Texte gibt. Die sagen, wer seine Bilder nicht selbst beschreiben kann (z. B. aufgrund von Behinderungen von Autismus-Spektrum-Strung ber ME/CFS bis Blindheit), soll eine KI zur Hilfe nehmen. Andere sagen, Bilder drfen auf gar keinen Fall mit KI beschrieben werden. Sie mssen aber trotzdem sofort mit Alt-Text gepostet werden, und zwar mit handgeschriebenem.
Es passiert stndig, da Alt-Text-Polizisten Nutzer anblaffen, weil die mal ein Bild nicht sofort mit sauberem, akkuratem, hinreichend detailliertem und definitiv komplett handgeschriebenem Alt-Text gepostet haben. Wohlgemerkt, Nutzer, von denen die Alt-Text-Polizisten wten, da die gar keine Alt-Texte schreiben knnen, wenn sie sich mal die Mhe machen wrden, sich deren Profil anzugucken. Da steht dann auch schon mal klar und deutlich, da der Nutzer blind ist.
Dann gibt's die, die in irgendeinem Alt-Text-Leitfaden fr statische Websites oder Blogs mal gelesen haben, Alt-Texte drfen nicht lnger als 125 Zeichen sein. , auch wenn Alt-Texte trotzdem eigentlich kurz sein sollen.
So, dann kommen aber die, die sagen, das Fediverse hat ein Zeichenlimit fr Alt-Texte von 1.500 Zeichen (was brigens so nicht mal korrekt ist). Das kann man ruhig voll ausnutzen. Bilder mssen also im Fediverse schn detailliert beschrieben und, falls ntig, auch noch erklrt werden. Mal ganz davon abgesehen, da . Ein Alt-Text von unter 200 Zeichen ist laut diesen Leuten meistens vllig unzureichend.
Damit riskiert man, entweder von den einen auf den Deckel zu bekommen, weil die eigenen Alt-Texte zu lang sind, oder von den anderen, weil die eigenen Alt-Texte nicht detailliert genug sind, oder von beiden, weil sie irgendwo dazwischen sind.
Weil es keine Mglichkeit gibt, mit der Alt-Text-Polizei in irgendeiner Form etwas zu diskutieren bzw. sich von ihr beraten zu lassen, sind Spezialflle beim Posten von Bildern hochriskant. Je obskurer etwa ein Thema ist, je seltener davon Bilder gepostet werden, desto weniger gibt es ein schon greifbares Konzept, wie und vor allem wie detailliert die beschrieben werden mssen. Trotzdem riskiert man, auf den Deckel zu bekommen, wenn man es falsch macht.
Manchmal sind es auch einfach nur einzelne Konzepte, die nie zu Ende definiert worden sind. Beispielsweise Text-Transkripte. So, wie die Regel formuliert ist, mu alles an Text innerhalb der Grenzen eines Bildes immer exakt Zeichen fr Zeichen transkribiert werden.
Aber was, wenn der Text auf dem Bild so klein ist, da er auf dem Bild selbst nicht lesbar ist Wenn der Text so winzig ist, da er nicht als Text erkennbar oder gar im Grunde unsichtbar ist Wenn der Text teilweise verborgen ist hinter z. B. einem Objekt, das davor steht Wenn man aber trotzdem wei oder herausfinden kann, was da geschrieben steht, also durchaus in der Lage ist, diese Texte zu transkribieren
Weil diese Regel den Sonderfall des nicht lesbaren Textes nicht einmal in Erwgung zieht, geschweige denn tatschlich mitbehandelt, ist unklar, ob solche Texte transkribiert werden mssen, transkribiert werden sollten, transkribiert werden drfen oder auf gar keinen Fall transkribiert werden drfen.
Zum Thema Erklrungen: Hier ist unklar, ob die wirklich zwingend notwendig sind. Unklar ist auch, ob man wirklich alles bis auf die Grundlagen erklren mu, damit auch wirklich niemand irgendetwas nachschlagen oder Fragen stellen mu. Unklar ist auch, ob man alles selbst erklren mu oder Links auf externe Erklrungen erlaubt sind. Einige sagen jetzt natrlich: "Links sind doof, das mu schon im Post selbst erklrt werden!" Da ist dann wieder unklar, ob die ein Problem damit haben, wenn ich 10.000, 15.000, 20.000 oder mehr Zeichen an Erklrungen in den Post einbaue.
Aus diesen Grnden poste ich selbst nur noch sehr selten Bilder. Selbst wenn ich Memes poste, ist die rein visuelle Beschreibung im Alt-Text nebst Transkripten der zum Meme gehrenden Texte noch bersichtlich. Aber weil auch meine Memes immer ber sehr obskure Themen sind, gibt es dann immer im Post selbst sehr viel zu erklren.
Meine eigenen Bilder beschreibe ich sogar zweimal, einmal relativ kurz im Alt-Text und noch einmal hochdetailliert im Post-Text. Die Bildbeschreibung im Post-Text enthlt auch immer Transkripte von allen Textschnipseln innerhalb der Bildgrenzen, lesbar oder nicht, und alle notwendigen Erklrungen. Der Alt-Text weist zustzlich noch auf die lange Beschreibung im Post-Text hin.
Nur ist das ein Aufwand von mehreren Stunden bis hin zu mehreren Tagen. Und weil keiner meiner Kanle im Fediverse nennenswerte Reichweite hat, ist dieser Riesenaufwand im wesentlichen eine Vorsichtsmanahme, um mglichst viele Bedrfnisse abdecken zu knnen, ohne da jemand fragen mu, und mglichst allen tatschlichen und vermuteten Mindeststandards weit voraus zu sein.
Wenn ich mich vorher mit a) Blinden und Sehbehinderten und b) der Alt-Text-Polizei irgendwo in einer Gruppe austauschen knnte, dann knnte ich vorab ausdiskutieren, was in welchem Grenzfall die optimale Lsung ist und was tatschlich zwingend notwendig ist. Dann htte ich hoffentlich diesen Riesenaufwand nicht.
# # # # # # # # # # # # # # # # #
Ah, yet another promising over "long-horizon tasks" while managing to say absolutely nothing! It's like watching a toddler explain quantum physics with a crayon. Spoiler: the "horizon" is still as distant as ever.
Also, an image doesn't always need the exact same alt-text whenever it's posted somewhere.
The alt-text must adapt to the context. It must be different according to the context in which an image is posted. Also, it must adapt to the place where it's posted. The same image, even within a very similar context, must have . Lastly, and this ties in with the Fediverse requiring different alt-texts, the audience must be taken into consideration.
Alt-text in metadata can't do either of this. An LLM can't do either of this either unless it's explicitly prompted to do so, and even that is questionable.
Many Mastodon users dream of only pressing a button or not even that, and some AI automagically generates a perfect alt-text for their image. Perfectly accurate with exactly the details required for the context and the intended audience as well as the expected audience, all while following every last image description and alt-text rule out there to a tee.
It's perfectly understandable. Mastodon had begun to feel like child's play when they were suddenly pressured into describing each and every image they post. Worse yet, it seems like over 90% of all Mastodon users do everything on a phone with no access to a hardware keyboard whatsoever. So they have to fumble their alt-texts into a screen keyboard while not even being able to see the image they're describing.
I'm neither on Mastodon nor on a phone. I've got the luxury of having a desktop computer with a hardware keyboard and being able to bllind-type. So I don't have a problem with writing my image descriptions myself with no help from an AI.
In fact, my own original images are all about an extreme niche topic. It's so obscure that no AI will ever be able to describe such images, much less explain them at my level of accuracy and detail. (, but I always have an additional image description in the post text for my original images anyway.)
I simply know things that no AI will ever know, not ChatGPT and not Claude either, at least not at the point in time when they need that knowledge. And I can see things that will always remain invisible for AIs.
You can develop better models all you want. But they'll never be able to do all that.
# # # # # # # # # # # # # # # # # #
Here's how you tell something is a .
With literally any other , such as , investors demand that you *increase * year over year, quarter after quarter -- or they're out.
When it's a bubble, that same investor class will buy, and buy, and hold, and buy, and buy, after year after year of negative . And they will keep putting in more.
The only time are ever is when it's a bubble.
Back to the Beach: Long Beach Comic Con (2014)
Photos and writeup: Indie comics, bargains, art, cosplay, Young Justice, and a mobile exhibit for the Flash TV show at this year's Long Beach Comic Con.
<>
<>
No, it doesn't.
Depending on the hub, it does have a choice of themes (Netzgemeinde and hubzilla.de don't), and even then, you can tinker with the layout a lot if you want to.
But it's hard-coded to no more than three columns, one centre column plus a maximum of two sidebars. And since it doesn't have the Mastodon client API implemented, and it never will, you can't use it with third-party apps either.
Be very careful, though, if you do move: Hubzilla is not just Mastodon with more characters and text formatting. There's hardly anything in the Fediverse that does *blogging that's more different from Mastodon than Hubzilla.
On the other hand, Hubzilla probably has the best built-in help of all Fediverse server applications. And it has its own support forums, so if you need help, you don't have to shout into the void and hope that someone will catch your hashtags.
# # # # # # # # # Actually, you must never do either.
That's because , be it due to physical disabilities (you can't access alt-text if you don't have at least one working hand, at least not easily), be it due to their choice of software.
If there's any information not in the image, not in the post text, only in the alt-text, then these people will not be able to get this information. It's lost to them.
So !
If you need more than 500 characters
once, write a thread.
If you need more than 500 characters
regularly, move to where you have more characters, e.g.:
- a Mastodon server with a higher character count
- a Mastodon fork with a higher character count
- Misskey (3,000 characters)
- Sharkey (at least 3,000 characters, often even more)
- Akkoma (at least 5,000 characters)
- Friendica (16,777,215 characters)
It's all part of the Fediverse, i.e. it's all fully federated with Mastodon. (Greetings from Hubzilla which has over 16M characters, too).
# # # # # # # # # # # # # # # # # # I'm occasionally working on my own extensive wiki about alt-texts and image descriptions in the Fediverse. It's still very much a WIP, and not even half of the planned pages are done, and it specialises in the Fediverse (not only Mastodon, by the way). But maybe you'll find something there that's useful for static websites as well.
If that shouldn't suffice, I've got more than 50 articles, pages etc. about alt-texts and image descriptions linked on , including 25 articles by Veronica Lewis a.k.a. Veronica with Four Eyes.
# # # # # # # # # # # # # # #
Choo Young-woo and Lee Se-young sign up for Long Vacation
Long Everyone should be able to build, and as long as this freedom to build does not exist, the present-day planned architecture cannot be considered art at all.
Friedensreich Hundertwasser
The CMS is dead. Long live the CMS
Hype for the Future 153J: City of Ludowici, Georgia
OverviewThe City of Ludowici is a city located within and the county seat of Long County, Georgia, within the United States of America. The community is located along Routes 84, 301, and 57, within relative proximity to the Atlantic Ocean to the east.
, .
<>
,
<>
A woman dies and ends up at the pearly gates. There's a long line. St. Peter is asking people questions:
"Mrs. Sanchez. Let's see here... how much money did you make in your lifetime"
The woman seems confused, says she can't recall.
"About 1.5 million euros," says St. Peter. "How much of that did you use to help others"
Again she doesn't know.
"Over 70 percent! Welcome to heaven, Mrs. Sanchez."
The next man in line tells St. Peter that he made over half a billion in his life.
"And how much of that did you use to help others, Mr. Johnson"
The man begins talking about the various charitable foundations his company created, his philanthropic giving...
"Mr. Johnson," Peter interrupts, "between the tax writeoffs and the circular charity you used less than one percent of your income to help anyone else."
Mr. Johnson's protest is cut short by the trap door beneath his feet. His scream echoes as he falls.
Eventually it is the woman's turn. Peter glances at her and then his huge ledger.
"Ms. Smith, how much money did you make in your lifetime"
She thinks for a moment then Peter answers for her,
"Okay. It looks like you made about sixty thousand American dollars in total... what instrument did you play"
Choo Young Woo and Lee Se Young Hold Script Reading for Fantasy Romance Netflix K-drama Long Vacation
, .
<>
.
<>
,
<>
, .
<>
Would be interesting to add Hubzilla's Zot6 and (streams)' Nomad (which would be Zot12 if it wasn't incompatible with Zot6) to the list.
By the way: Forte doesn't require a gateway to communicate with non-nomadic ActivityPub. A fully cloned Forte channel can communicate with a Mastodon account without jumping through hoops. Remember that Forte has almost fully-featured Hubzilla-level nomadic identity (i.e. everything except real-time syncing between channel instances unlike Hubzilla and (streams) which do sync in real time, it needs a cronjob for that) directly built into its core.
(streams) does support nomadic identity via ActivityPub. But internally, it uses and relies upon Nomad for its nomadic identity. It only supports nomadic identity via ActivityPub a) because it was used as a development platform for just this and b) in order to be able to understand cloned nomadic ActivityPub actors elsewhere. This is also why it isn't possible to move from (streams) to Forte, to move from Forte to (streams) or to clone between (streams) and Forte.
(streams) itself doesn't require gateways to communicate with Mastodon & Co. either. It speaks three protocols natively: its own Nomad, Hubzilla's Zot6 and (optionally, but on by default) standard ActivityPub.
# # # # # # # # # # # # # # # # # Sorry, aber das Verlinkte lt sich nicht immer zwingend zu 100% anwenden und im Fediverse schon mal erst recht nicht.
100 Zeichen sind zum einen eine hoffnungslos veraltete Beschrnkung. Zum anderen reichen sie bei so manch einem Bild bei weitem nicht aus, um alle Qualittskriterien einer guten Bildbeschreibung zu erfllen. Und glaube mir, ich habe schon gelesen, da ich wei, wovon ich spreche. Insbesondere mchte ich hier verweisen auf .
Die Regel, da Text in Bildern immer zu 100% originalidentisch transkribiert werden mu, kenne ich, und damit gehe ich weitgehend konform (bis darauf, da Text, der im Original in Grobuchstaben geschrieben ist, nicht in Grobuchstaben transkribiert werden darf). Daran halte ich mich selbst, egal, wieviel Text auf meinen eigenen Bildern ist, und egal, ob er auf den Bildern, wie ich sie poste, lesbar ist oder nicht. Aber wie soll das garantiert immer in 100 Zeichen passen
Aktuell arbeite ich seit etwa anderthalb Jahren (!) gelegentlich an den Bildbeschreibungen fr eine Serie von Portraits eines digitalen Avatars in einer virtuellen 3-D-Welt deshalb habe ich auch seit Sommer 2024 kein einziges gnzlich eigenes Bild mehr gepostet. Die Bilder haben schon einen neutralen weien Hintergrund, damit ich den Hintergrund nicht beschreiben mu. Nun enthlt aber jedes Bild drei oder vier leicht unterschiedliche Outfits. Und in den geplanten Posts mit diesen Bildern geht es um diese Outfits, d. h.
die Outfits sind der Kontext.
Ich halte mich dabei an und bei Farben an . Das heit, das knnen keine superkurzen Beschreibungen werden wie z. B. bei Katzenfotos.
Die Bilder sollen sogar wie alle meine eigenen Bilder jeweils zweimal beschrieben werden: Jedes Bild bekommt eine vergleichsweise kurze Beschreibung im Alt-Text. Zustzlich wird jeder Post einen Block enthalten mit langen, detaillierten Bildbeschreibungen inklusive allen Erklrungen, die ntig sind, um die Bilder und die Beschreibungen zu verstehen. Dieser Block wird wahrscheinlich in jedem Bilderpost jeweils lnger als 20.000 Zeichen ausfallen. Das ist notwendig, weil .
Trotzdem mssen natrlich auch die Beschreibungen in den Alt-Texten gewisse Mindestkriterien erfllen. In 100 Zeichen oder weniger ist das schlicht und ergreifend unmglich. Ich habe tatschlich groe Schwierigkeiten, die Alt-Texte auf maximal 1.500 Zeichen einzukrzen. Und nein, die sind nicht mit Fllworten aufgeblht. Ich kann sie nur weiter krzen, indem ich gem den oben verlinkten Artikeln wichtige Informationen entferne.
Generell . Das 100-Zeichen-Limit ist Bullshit. Das 125-Zeichen-Limit ist Bullshit. Das 200-Zeichen-Limit ist Bullshit. . Das einzige Limit, das gilt, ist Mastodons 1.500-Zeichen-Limit. Solange Bildbeschreibungen nicht knstlich aufgeblht sind mit Fllworten, persnlichen Wertungen etc., ist alles innerhalb dieser 1.500 Zeichen erlaubt.
Dazu gilt: Wenn jemand dich darum bittet, ein Detail auf deinem Bild genauer zu beschreiben, dann ist deine Bildbeschreibung ungengend. Auch wenn jemand dich um Erklrungen bittet, ist das zurckzufhren auf Nachlssigkeit deinerseits (). Nach Details oder Erklrungen zu fragen, ist fast so schlimm, wie berhaupt um Alt-Text bitten zu mssen.
Wenn du konsequent immer mit Alt-Texten kommst, die nie die 100 Zeichen berschreiten, dann riskierst du, da dir jemand von Mastodons Alt-Text-Polizei deine Alt-Texte als unzureichend um die Ohren haut und dich als faul und ableistisch abstempelt. Wenn du dagegen Bilder mit 1.000 Zeichen und mehr beschreibst, besteht die Chance, da du in der landest.
# # # # # # # # # # # # # # # # # # # # # #
.
<>
, .
<>
Choo Young Woo And Lee Se Young Confirmed For New Fantasy Romance Drama "Long Vacation"
I have two major issues with the Mastodon HOA.
One, they try hard to force "Mastodon standards", Mastodon culture and Mastodon's unwritten rules upon the whole Fediverse. Including places that not only aren't Mastodon, but that are
very much not Mastodon. Simply because they can't see where a message is from. In fact, many of them are still fully convinced that the Fediverse is only Mastodon.
And so you have members of the Mastodon HOA yelling at someone who is allegedly "doing Mastodon wrong", but that someone is actually on and has been since as early as 2011. As in about five years longer than Mastodon has even existed. And seriously, the only places in the Fediverse that are even more different and farther away from Mastodon than Friendica (without specialising in something that Mastodon absolutely can't do) are Friendica's own descendants: , , .
The Mastodon HOA probably don't know that Friendica exists. They definitely don't know that either of the other three exists. They definitely don't know that any of the four is significantly different from Mastodon in any way. And frankly, they don't care a bit. If it appears on any Mastodon timeline, it's Mastodon to them, and it has to adapt to Mastodon's culture and follow Mastodon's rules.
Two, they don't coordinate anything among each other. They're just a bunch of lone wolves. Everyone has got their own standards, but everyone thinks their personal standards are the one and only Mastodon/Fediverse gold standards, and everyone enforces their own standards. And, of course, everyone thinks their standards can and must apply
always, including in the most obscure edge-cases.
For example, they've got standards for describing real-life photos on Mastodon with a character limit of 500. And they try to enforce these standards always and everywhere. However, these standards don't necessarily work perfectly when I post a rendering from on (streams) with a character limit of
over 24 million where I've got
loads of room to write an additional long image description and put it into the post text.
The Mastodon HOA, or at least some of their members, appear to be constantly raising their minimum quality requirements for image descriptions. They must be absolutely accurate, and they must be sufficiently detailed that nobody will ever have to ask for a detail description. Oh, and they must explain whatever the audience may not know about the image or the description. (At this point, it's fair to mention that .)
Sure, I can do that. I have done so in the past. But I can't do that within Mastodon's alt-text character limit of 1,500 (Mastodon truncates longer alt-texts from outside). I can do that even less within Misskey's alt-text character limit of only 512 (Misskey and the Forkeys
should truncate longer alt-texts, but due to a bug, they delete them entirely instead, giving the impression that you haven't written an alt-text at all). I can only do that in the additional long description in the post text.
If the Mastodon HOA demand I transcribe literally any and all text within the borders of an image, I can do that, too. In fact, I have done so in the past. I can transcribe bits of text verbatim which the Mastodon HOA can't even read. Which the Mastodon HOA couldn't even find in the image because they're so tiny. But there's no way that I can squeeze 20+ individual text transcripts into 1,500 characters of alt-text along with the rest of the visual description, much less into only 512 characters. The text transcripts will have to go into the long description in the post text, whether the Mastodon HOA want or not.
This means that the post will exceed the holy limit of 500 characters
by huge magnitudes. This, in turn, means that when I've satisfied one Mastodon HOA member, another one comes and sanctions me for exceeding the holy 500-character limit. That is, chances are it's actually the same Mastodon HOA member.
In other words, if the content of an image is obscure enough and requires enough description, the only winning move when I want to post such an image is to not post it at all.
# # # # # # # # # # # # # # # # # # # # # # Especially whenever humans have advantages over LLMs.
When I describe my own original images, I have two advantages.
One, I know much more about the contents of the image than any AI. That's because my original images always show something from extremely obscure 3-D virtual worlds. On top of that, I may add some extra insider knowledge or explain pop-cultural references in the long description in the post if it helps understand the image and its descriptions.
Two, the LLM can only look at the image with its limited resolution. That's all it has. In contrast, when I describe my images, I don't just look at the images. I look at the real deal in-world with a nearly infinite resolution.
For example, an LLM can only generate a description from a picture of a virtual building. But when I describe it, my avatar is in-world, standing right in front of the building whose picture I'm describing. I can move the avatar around, I can move the camera around, I can zoom in on anything. I can correctly identify that four-pixel blob as a strawberry cocktail wheras the LLM doesn't even notice it's there.
I've actually done two tests using LLaVA. I've fed it two images I had described myself previously to see what happens. It was abysmal. LLaVA hallucinated, it interpreted stuff wrongly and so forth, not to mention that LLaVA's description, even after being prompted to write a detailed description, wasn't nearly as detailed as mine.
In one image, there's an OpenSimWorld beacon placed rather prominently in the scenery. LLaVA completely ignored it. I described what it looks like in about 1,000 characters, and then I explained what it is, what OpenSimWorld is and how it works in another 4,000 characters or so.
It's an illusion that AI will soon catch up with any of this.
Oh, by the way: How is an AI supposed to pinpoint exactly where an image was made if the image shows a place of which multiple absolutely identical copies exist Or if the image has a neutral background that doesn't even hint at where it was made I can do that with no problem because I remember where I've made the image.
# # # # # # # # # # # # # # #
, .
<>
<>