med-mastodon.com is one of the many independent Mastodon servers you can use to participate in the fediverse.
Medical community on Mastodon

Administered by:

Server stats:

347
active users

#texttospeech

6 posts5 participants0 posts today

Hi y’all!
v0.1.0 of my portable text to speech device software was released!
Information about it can be found at https://git.ka-so.me/kasanwa-solane/portable-tts

Why did I make this?
I made it as a tool for my personal accessibility toolbox. There’s times that, for various reasons, I struggle with speech, but am expected to speak aloud or that speech is the modality for communication most useful in said context. This allows me to produce speech in a recognizable facsimile of my voice by typing it on a dedicated device.

Why a dedicated device?
Sometimes, I’m in situations where smartphones are disallowed, as well as any device with an integrated camera or microphone. A dedicated accessibility device that deliberately does not have those input modalities is much more acceptable in those spaces.

Everyone is encouraged to boost this post and/or share the link elsewhere. I want the people who might have a use case for this device to be able to find it.

Summary card of repository kasanwa-solane/portable-tts
Kasanwa Solane's Forgejoportable-ttsportable-tts
Replied in thread

@DigitaleEthik es gibt genug Optionen um die Anonymität von Personen sicherzustellen ohne #WastefulComputing welches nur #Großkonzernen in der #AiBubble hilft und allein wegen der enormen Ressourcenverschwendung ethisch auf dem Niveau von #Shitcoins wie #Bitcoin ist:

  • #Anonymous hat das mit #TextToSpeech vor 15+ Jahren schon gelöst.

  • Die meisten modernen Animationswerkzeuge haben Lippensynchronisation (Das Feature ist über 10 Jahre alt in Source Film Maker!)

  • Der Einsatz von "#KI-Charaktern" als Moderatoren wird eher der Seriösität schaden, weil es nunmal das #UncannyValley gibt.

  • Der #ModiOperandi von "KI-Inhalten" wird damit von #Desinformation weg normalisiert, was inhärent so ethisch falsch ist wie #Misgendering und #Deadnaming!

M.a.W.: Nur weil #Propaganda-Produzenten und #Desiformationsschleudern wie #RIAnovostri / #RT / #sputnik / #redfish , #CCTV / #CGTN & #IRIB / #PressTV dies tun wird es nicht weniger falsch!

  • Es ist naiv anzunehmen dass Regime wie #Venezulea nicht wissen, wer jene #Redakteur*innen sind.

  • Die Nutzung von Pseudonymen existiert und funktioniert.

  • Es dürfte sicherlich "fotogene" Exil-Oppositionelle geben die als Nachrichtensprecher*in vor ner Kamera taugen.

Ich betrachte daher "KI"-Nutzung abseits von Digen die keine "KI" sind sondern efektiv nur #Mustererkennung auf #BigData-Basis für bestenfalls hochgradig fragwürdige #Ressourcenverschwendung, egal ob #Energie oder #Hardware!

  • Gerade bei #Journalismus ist dies zu hinterfragen.

  • Zumal die Resultate bisher nichtmals als #Broll taugen sondern extrem #cringe sind!

Es gibt keinen Grund anzunehmen dass "KI im Journalismus" irgendeinen positiven Effekt hätte, sondern eher dass dies vgl. "#Pressefreiheit für #Medien aus Staaten die systematisch gegen Pressefreiheit agieren" (und #Journalist*innen im Inland oder gar auch Ausland aktiv verfolgen, foltern, verschwindenlassen und z.T ermorden!) eher das Gegenteil bewirkt…

When large language models, LLM run by big corporations, do good things for you it's nice enough to get a chuckle. In this example, of which I will show you the original photograph first, then the screenshot of what Lens did for me, you will see how handy it is, that Lens superimposes an extra layer with the translated text, in any of the hundreds of languages that that large language model supports