3 minute read

Multimodale LLM

https://you.com/

https://www.perplexity.ai/

ct.de/yby1

You.com

Perplexity

OpenAI Voice Engine

HeyGen: Demo für synthetische Avatare

Arcads: Avatare

Humanoider Roboter von Figure

Sozialer Roboter Navel

AI Pin

Rabbit R1

https://openai.com/index/navigating-the-challenges-and-opportunities-of-synthetic-voices/

Challenges and Opportunities of Synthetic Voices We’re sharing lessons from a small scale preview of Voice Engine, a model for creating custom voices.

AI-powered video creation at scale TalkingPhoto or Real Person Avatar

Effortlessly produce studio-quality videos with AI-generated avatars and voices. Create your first HeyGen avatar video in motion!

https://demo.heygen.com/

Real Person Avatar

Talking Foto

Create winning ads with AI Actors - arcads.ia

Generate 100s of winning videos from text.

Humanoide Roboter: OpenAI bringt Figure 01 zum Sprechen und “Denken”

https://www.heise.de/news/Humanoide-Roboter-OpenAI-bringt-Figure-01-zum-Sprechen-und-Denken-9655861.html

ChatGPT im Pflegeheim: So schlägt sich der soziale Roboter Navel

Der soziale Roboter Navel nutzt KI und spricht Menschen an. In einem Pflegeheim in Hannover haben wir ein Testmodell getroffen: Wie gut kann er mit Menschen?

https://www.heise.de/hintergrund/ChatGPT-im-Pflegeheim-So-schlaegt-sich-der-soziale-Roboter-Navel-9643725.html?seite=all

https://humane.com/

https://www.rabbit.tech/

c’t 11/2024 S. 81 Aktuell Web-Tipps KI-News, täglich frisch

https://www.heise.de/select/ct/2024/11/2330613091658322433

<heise.de/thema/KI-Update >

Die c’t fasst zweiwöchentlich die wichtigsten KI-News zusammen. Wenn Sie sich zu KI aktueller informieren möchten, erhalten Sie werktäglich ein News-Paket von den Kollegen bei heise online. Montags bis donnerstags fasst der Podcast KI-Update Nachrichten zusammen, freitags bereitet er ein wichtiges Thema der Woche ausführlich auf. Falls Sie lieber lesen als hören: Im Newsticker finden sich verschriftlichte Zusammenfassungen der einzelnen Ausgaben. Noch mehr KI-News finden Sie beim Online-Magazin The Decoder, das sich ausschließlich mit News um KI befasst. (jo@ct.de) ## Gesammelte KI-Forschung - Website Papers with Code <http://paperswithcode.com > Die Betreiber der Website Papers with Code haben es sich zur Aufgabe gemacht, wissenschaftliche Veröffentlichungen, Code, Datensätze, Methoden und Auswertungstabellen zum maschinellen Lernen zusammenzutragen. Die mehr als 120.000 Einträge der Datenbank lassen sich im Volltext durchsuchen. Zu wichtigen Themen gibt es Übersichtsseiten, die die relevantesten Inhalte verlinken. (jo@ct.de) ## Stilvorlagen für Midjourney & Co. <midjourneypromptsgenerator.com/styles-viewer > <http://midlibrary.io > <http://artificin.com/prompt-builder > KI-Bildgeneratoren wie Midjourney werfen beeindruckende Werke aus, wenn man sie mit den passenden Anweisungen, Prompts genannt, steuert. Ein wesentliches Element ist dabei der Stil. Auf „Dali“ oder „Franz Marc“ kommt man dabei noch selber – aber wie heißen die Künstler der ikonischen japanischen Druckgrafik? Vielleicht will man sich auch gar nicht so sehr an den Namen der Künstler und Stilrichtungen orientieren, die man schon kennt, sondern sich von Bildeindrücken inspirieren lassen. Webdienste wie der Midjourney Prompt Generator, die Midlibrary und der Midjourney Prompt Builder ermöglichen das, indem sie Hunderte Beispielbilder zeigen, die mit bestimmten Vorgaben erzeugt wurden. Der Styles Viewer zum Beispiel zeigt je vier Bilder zu Dutzenden Stilrichtungen. Die Midlibrary verzeichnet knapp 5000 Stile, die sie zum Beispiel nach der verwendeten Technik oder nach Eigenschaften wie „Dark“ erschließt. (jo@ct.de) ## Botnetz chirper.ai Gängige soziale Netze wie X oder Facebook stehen schon mal im Verdacht, großflächig von (KI-)Bots unterwandert zu sein, die dort massenhaft Fake News verbreiten. Chirper ist einen Schritt weiter: Dort kommunizieren ausschließlich KI-Bots. Menschen können dort zwar privat mit einzelnen sogenannten Chirpern chatten, öffentlich tauschen sich aber nur Bots aus. Man kann auch eigene Chirper erschaffen, indem man ihnen eine kurze Biografie und Hintergrundgeschichte gibt. Der Dienst erzeugt dann ein paar Bilder für den Bot, aus dem man eines auswählt. Anschließend kann man seinem Bot zuschauen, wie er sich mit anderen austauscht. Der Dienst scheint manchmal an seine Kapazitätsgrenzen zu kommen. Die Seiten laden dann langsam. (jo@ct.de) ## Wegweiser für Entwickler ai-guide.future.mozilla.org Wer sich als Entwickler in das Thema Sprachmodelle einarbeiten will, der findet in diesem Heft einen guten Startpunkt. Einen weiterführenden, vor allem aber laufend aktualisierten Überblick versucht die Mozilla Foundation mit ihrem englischsprachigen AI Guide zu geben. Er startet mit allgemeinen Erklärungen über Sprachmodelle, zeigt, wie man ein passendes Modell für seine Zwecke auswählt und demonstriert am Beispiel von Mistral_7B, wie man eine Sprach-KI lokal zum Laufen bringt. Der AI Guide ist als Gemeinschaftsprojekt ausgelegt. Jeder ist eingeladen, Beiträge beizusteuern, um den Guide zu erweitern. (jo@ct.de) Diese Seite mit klickbaren Links: ct.de/ynfp <https://www.heise.de/select/ct/2024/11/softlinks/ytpn?wt_mc=pred.red.ct.ct112024.104.softlink.softlink > ## ChatGPT OpenAI <https://chatgpt.com/?oai-dm=1 > ![](../_asset/2024-05-09-multimodalLLM_image_11.jpg) ## Google Gemini https://gemini.google.com/?hl=de ![](../_asset/2024-05-09-multimodalLLM_image_12.jpg) ## Claude AI https://claude.ai/login?returnTo=%2F%3F ![](../_asset/2024-05-09-multimodalLLM_image_13.jpg) ## Aleph Alpha https://app.aleph-alpha.com/ ![](../_asset/2024-05-09-multimodalLLM_image_14.jpg) ## Mata LLama https://llama.meta.com/docs/get-started/ ![](../_asset/2024-05-09-multimodalLLM_image_15.jpg) ![](../_asset/2024-05-09-multimodalLLM_image_16.jpg)