Künstliche Intelligenz: Anwendungen, die über Chat GPT hinausgehen

Künstliche Intelligenz: Anwendungen, die über Chat GPT hinausgehen

Giovanni Blandino Veröffentlicht am 5/17/2024

Es scheint mittlerweile fast gewiss, dass Künstliche Intelligenz die Technologie darstellt, welche unser Leben und unsere Arbeitswelt in der nahen Zukunft am stärksten beeinflussen wird. Seitdem ChatGPT eingeführt wurde – eine KI, die anscheinend fähig ist, auf alle unsere Fragen zu antworten –, hat das Interesse an dieser und weiteren KI-Anwendungen sprunghaft zugenommen.

Branchenexperten und Investoren zeigen großes Interesse, aber auch Verbraucher, Unternehmen und generell Neugierige beginnen, den Trend KI-basierter Apps aufmerksam zu verfolgen.

Anwendungen und Plattformen, die auf Künstlicher Intelligenz basieren, sollen uns nicht nur Gesellschaft leisten und vielfältige Fragen beantworten, sondern werden voraussichtlich auch in vielen anderen Bereichen unterstützend wirken: Sie sollen die Erfahrung bei der Online-Suche verbessern, Unternehmen im Kundenservice unterstützen, die Erstellung und Optimierung von Artikeln, Bildern und Videos erleichtern, Vorschläge für Programmiercodes machen und Ratschläge zur Produktivitätssteigerung in Geschäftsprozessen bieten.

Auf künstlicher Intelligenz basierende Anwendungen, die in den kommenden Monaten zu beobachten sind
Auf künstlicher Intelligenz basierende Anwendungen, die in den kommenden Monaten zu beobachten sind

Doch welche KI-basierten Apps gibt es derzeit auf dem Markt? Mit welcher Technologie arbeiten sie? Und was genau tun sie? Erfahren Sie mehr über die Produkte, die bereits verfügbar sind und jene, die bald eingeführt werden.

Hier sind alle Beispiele, Anwendungen und Plattformen für Künstliche Intelligenz, die Sie in den nächsten Monaten im Auge behalten sollten.

  • ChatGPT – der aktuell populärste Chatbot der Welt, basierend auf KI
  • Google Bard – Googles Alternative zu ChatGPT, die die Welt der Suchmaschinen revolutionieren könnte
  • Midjourney – ein Beispiel für KI zur Erstellung von Bildern aus Textbefehlen
  • DALL-E 2 – eine weitere KI-App zur Umwandlung von Text in Bilder, die Beachtung verdient
  • Writesonic – KI-Technologie für das Verfassen von Artikeln und Inhalten für soziale Medien
  • Synthesia – ein Beispiel für KI zur Erstellung von Videopräsentationen
  • GitHub Copilot– eine App, die Entwicklern beim Schreiben von Softwarecode mithilfe von KI unterstützt

Wo könnte man besser beginnen als bei ChatGPT? Diese KI-App hat in den letzten Monaten die meisten Kommentare und das größte Interesse hervorgerufen. Der Blogpost, mit dem sie im November 2022 vorgestellt wurde, wird von vielen als technologiegeschichtliches Ereignis angesehen, das mit der Präsentation des ersten iPhones im Jahr 2007 vergleichbar ist.

Auf künstlicher Intelligenz basierende Anwendungen: ChatGPT
Auf künstlicher Intelligenz basierende Anwendungen: ChatGPT

Technisch betrachtet handelt es sich bei ChatGPT um einen Chatbot, also eine App, die auf künstlicher Intelligenz basiert. Diese Anwendung versteht natürliche Sprache und beantwortet Fragen der Nutzer konsequent in derselben Sprache. ChatGPT kann auf vielfältige und natürliche Weise um Informationen gebeten werden, wie zum Beispiel “Kannst du diesen Text für mich übersetzen?” oder “Was ist die französische Revolution?”. Unter den täglichen Anfragen der mehr als 600 Millionen Nutzer befinden sich viele zu Themen wie Gedichte, Programmiercode, Fachartikel, Schulaufgaben oder philosophische Diskussionen.

Ein Beispiel für eine auf künstlicher Intelligenz basierende Anwendung: ChatGPT
ChatGPT wird gebeten, eine böse künstliche Intelligenz zu spielen. Quelle: Reddit

Aktuell basiert ChatGPT auf dem GPT-3.5-Modell, einem künstlichen neuronalen Netz, das auf Hunderten Milliarden von Online-Texten trainiert wurde. Die KI-Anwendung wurde von OpenAI entwickelt, einem Unternehmen, das von Elon Musk und Sam Altman gegründet und an dem Microsoft wesentlich beteiligt ist.

Zum Zeitpunkt der Erstellung dieses Artikels [März 2023] hat ChatGPT auch seine Grenzen. Die Trainingsdatenbank endet im Jahr 2021, was bedeutet, dass ChatGPT Ereignisse der letzten zwei Jahre nicht kennt. Interessant, nicht wahr? Zudem ist es eine rein textbasierte KI; sie kann weder Bilder, Videos noch Sprachbefehle verstehen oder erzeugen. Einige dieser Einschränkungen könnten jedoch mit dem nächsten Upgrade auf GPT-4 behoben werden.

Zurzeit ist die Software nach einer Anmeldung hier kostenlos online verfügbar. Aufgrund des hohen Anfrageaufkommens ist es jedoch oft schwierig, darauf zuzugreifen.

Zusammenfassend lässt sich sagen, dass ChatGPT:

  • Eine App ist, die auf künstlicher Intelligenz für Konversationen basiert (Chatbot)
  • Auf Texteingaben mit formulierten Antworten in natürlicher Sprache reagiert
  • Ausschließlich textbasiert ist und keine Audios oder Bilder beinhaltet
  • Derzeit kostenfrei ist

Google Bard

Google Bard wird als Googles Antwort auf ChatGPT vorgestellt. Derzeit [März 2023] ist diese KI-App noch nicht veröffentlicht und nur einer sehr kleinen Nutzergruppe zugänglich.

Beispiele für künstliche Intelligenz: Google Bar
Beispiele für künstliche Intelligenz: Google Bar

Bislang ist bekannt, dass Google Bard, ähnlich wie ChatGPT, eine KI-basierte Konversations-App, besser bekannt als Chatbot, ist. Obwohl noch keine detaillierten Informationen zu seinen Fähigkeiten vorliegen, wird erwartet, dass Google Bard konsistent auf verschiedene Arten von Nutzereingaben reagieren kann. Google plant insbesondere, Bard in seine Suchmaschine zu integrieren, um die Internetsuche zu revolutionieren und sie zuverlässiger und sprachnäher zu gestalten. Ähnlich wird ChatGPT in Bing, die Suchmaschine von Googles Hauptkonkurrenten, integriert.

Google Bard basiert auf der LaMDA-Technologie (Language Model for Dialogue Applications), einer Familie künstlicher neuronaler Netze, die seit 2020 von Google für die Sprachanwendung entwickelt wird.

Zusammenfassend lässt sich sagen, dass Google Bard:

  • Ein Chatbot ähnlich ChatGPT, entwickelt von Google
  • Im Februar 2023 angekündigt wurde, jedoch noch nicht öffentlich ist
  • Die Google-Suche verbessern wird

Midjourney

Midjourney ist, stark vereinfacht, die Bildversion von ChatGPT.

Midjourney ist eine KI-basierte Text-zu-Bild-App, das heißt, eine künstliche Intelligenz, die Bilder aus den Texteingaben eines Nutzers erstellt. Der Nutzer kann die Software beispielsweise bitten, eine Illustration einer Frau auf einem Fahrrad im Stil von Picasso oder eine Alpenlandschaft mit Cyberpunk-Elementen zu erstellen.

Künstliche Intelligenz App: Midjourney
Künstliche Intelligenz App: Midjourney

Nach der ersten Texteingabe liefert die Anwendung vier Bilder, die weiter bearbeitet werden können, bis das gewünschte Ergebnis erreicht ist. So kann man die Software beispielsweise bitten, bestimmte Elemente wie Gebäude im Hintergrund zu entfernen, ein spezifisches Format zu wählen oder einen völlig anderen Stil anzuwenden.

Beispiele für künstliche Intelligenz: Midjourney
Das Cover des Economist wurde dank Midjourney erstellt. Quelle: The Economist

Midjourney wurde im Juli 2022 von einem unabhängigen Labor in San Francisco als Beta-Version veröffentlicht und ist auch derzeit noch verfügbar. Die KI basiert auf maschinellem Lernen und wurde anhand einer umfangreichen Datenbank digitaler Bilder trainiert.

In den ersten Monaten zog diese KI-basierte Anwendung sowohl Interesse als auch Kritik auf sich. Das Titelbild des Economist vom Juni 2022 wurde mit Midjourney gestaltet, während eine sorgfältige Debatte über rechtliche, ethische und philosophische Fragen rund um den Einsatz dieser Art von KI geführt wurde.

Sie können eine kostenlose Testversion von Midjourney aktivieren oder die Anwendung mit einer kostenpflichtigen Lizenz nutzen. Midjourney kann hier aufgerufen werden.

Zusammenfassend lässt sich sagen, dass Midjourney:

  • Eine KI-Anwendung ist, die Bilder aus Text generiert
  • Die Nachbearbeitung von Bildern durch Hinzufügen von Details, Stilen oder technischen Parametern ermöglicht
  • Sich noch in der Beta-Phase befindet, aber sowohl in einer kostenpflichtigen als auch in einer kostenlosen Version verfügbar ist.

DALL-E 2

Ähnlich wie Midjourney basiert auch DALL-E 2 auf einer KI-gesteuerten Text-zu-Bild-Anwendung.

Diese Anwendung wurde 2021 von OpenAI, demselben Unternehmen, das auch ChatGPT entwickelt hat, eingeführt und befindet sich aktuell in ihrer zweiten, verbesserten Version gegenüber der ursprünglichen Software. Das künstliche neuronale Netzwerk, das der App zugrunde liegt, wurde mit einer umfangreichen Sammlung von Bildern und zugehörigen Beschreibungen trainiert.

DALL-E 2 verwendet dieselbe Technologie wie ChatGPT, allerdings mit dem Unterschied, dass es natürliche Sprache interpretiert und die entsprechenden Bilder generiert. Gibt man beispielsweise den Befehl „ein Gorilla spielt Computerspiele“ ein, erstellt die Anwendung ein realistisches Bild davon. Die App ermöglicht es nicht nur, spezifische Bilder von Grund auf zu erzeugen, sondern auch bestehende Bilder mittels einfacher Textbefehle zu modifizieren: Sollte Ihnen der Gorilla nicht mehr zusagen, können Sie die App anweisen: „Ersetze den Gorilla durch einen Teenager“.

Beispiel eines von AI DALL-E erzeugten Bildes 2. Quelle: https://openai.com/product/dall-e-2

Derzeit sind Midjourney und DALL-E 2 führende Beispiele für KI-gestützte Text-zu-Bild-Anwendungen. Es wird spannend sein, ihre Weiterentwicklung zu beobachten und zu sehen, wie sie sich voneinander unterscheiden. Derzeit sind die Hauptunterschiede zwischen den beiden Anwendungen vor allem in ihrem Stil erkennbar, wobei DALL-E 2 tendenziell fotorealistischere Bilder erzeugt als Midjourney.

DALL-E 2 ist von hier aus zugänglich. Sie können Ihre ersten Bilder kostenlos erstellen und bei Bedarf zusätzliche Credits erwerben, um Ihre Möglichkeiten zu erweitern.

Zusammenfassend lässt sich feststellen, dass DALL-E 2:

  • Die führende KI-Anwendung im Bereich Text-zu-Bild ist, zusammen mit Midjourney.
  • Einen realistischeren und fotografischeren Stil pflegt als ihre Mitbewerber.
  • Von OpenAI entwickelt wurde, dem Unternehmen hinter ChatGPT.

Writesonic

Writesonic ist eine App, die auf künstlicher Intelligenz fußt und sich dem Verfassen sowie der Verbesserung von Texten und Artikeln widmet – sie agiert quasi als digitaler Texter durch eine KI-Engine.

Durch den Einsatz von Modellen des Natural Language Processing (NLP) und maschinellem Lernen strebt Writesonic danach, Artikel unterschiedlicher Komplexität, Social-Media-Inhalte und Online-Werbetexte zu generieren. Zudem verwendet die App künstliche Intelligenz, um existierende Texte zu optimieren, beispielsweise durch das Verfeinern von Suchbegriffen oder die Unterstützung bei der Auswahl und Verwaltung der zu Artikeln hinzugefügten Bilder.

Künstliche Intelligenz App: Writesonic
Künstliche Intelligenz App: Writesonic

Die ursprüngliche und noch ziemlich grundlegende Version von Writesonic wurde 2020 von Garg Samanyou, einem indischen Computerwissenschaftler, ins Leben gerufen. Er verfolgte das Ziel, die Möglichkeiten künstlicher Intelligenz mit menschlicher Kreativität zu vereinen. Mittlerweile hat Writesonic auch eine eigene Alternative zu ChatGPT entwickelt: den Chatbot Chatsonic.

Ähnlich wie ChatGPT reagiert Chatsonic, eine auf künstlicher Intelligenz basierende Konversations-App, auf Texteingaben. Im Gegensatz zu seinem bekannteren Pendant kann Chatsonic jedoch auch auf Bilder reagieren und Sprachbefehle verstehen. Die App wurde auf einer aktuellen Datenbank trainiert, im Unterschied zu ChatGPT, dessen Datenbank im Jahr 2021 endet.

Sie können Writesonic bis zu einer gewissen Wortanzahl kostenlos nutzen, danach sind kostenpflichtige Abonnements erforderlich. Zugang zur App erhalten Sie hier.

Zusammengefasst lässt sich sagen, dass Writesonic:

  • Eine künstliche Intelligenz-App zur Erstellung und Optimierung von Textinhalten ist
  • Sowohl für das Verfassen von Artikeln, Blogposts, Social-Media-Inhalten als auch für Werbetexte eingesetzt wird
  • Vom selben Unternehmen stammt, das auch Chatsonic, eine Alternative zu ChatGPT, anbietet

Synthesia

Synthesia ist eine auf künstlicher Intelligenz basierende Plattform für die Videoproduktion. Diese Anwendung wurde im Jahr 2017 von einem Forscherteam der Universitäten Stanford, UCL, TUM und Cambridge entwickelt.

Synthesia ermöglicht es, über einen Webbrowser einfach Präsentationsvideos zu erstellen, indem Nutzer Texte eingeben, die dann von einem Avatar vorgelesen werden. Diese Videos sind momentan noch recht statisch. Der große Vorteil für Unternehmen besteht darin, dass sie zahlreiche Videos produzieren können, ohne ein umfangreiches Videoproduktionsteam oder teure Ausrüstung wie Mikrofone und Kameras benötigen zu müssen.

Beispiele für künstliche Intelligenz: Synthesia
Beispiele für künstliche Intelligenz: Synthesia

Die Funktionalität der App wird durch künstliche Intelligenz ermöglicht, die Sprache auf Lippenbewegungen der Avatare abstimmt und Stimmen erzeugt, die natürlichen Stimmen nachempfunden sind (zum Beispiel in Werbevideos für Finanz-Apps).

Aktuell bietet Synthesia die Auswahl aus über 85 Avataren, basierend auf echten Schauspielern, und 120 Sprachen, unter denen auch Italienisch ist. Bei einigen Sprachen ist sogar eine Anpassung des Akzents möglich. Um Zugang zu einer Demoversion zu erhalten oder um ein individuelles Angebot zu verhandeln, können Sie sich an das Unternehmen wenden. Die Grundversion der App kostet 26 Euro pro Monat.

Zusammenfassend lässt sich sagen, dass Synthesia:

  • Eine KI-gestützte App zur Erstellung von Promotionsvideos ist
  • Künstliche Intelligenz verwendet, um natürliche Stimmen zu synthetisieren und diese mit den Lippenbewegungen von Avataren zu synchronisieren

Für eine Demoversion kontaktieren Sie bitte das Unternehmen.

GitHub Copilot

Waren Ihnen bewusst, dass Anwendungen, die künstliche Intelligenz nutzen, auch Programmierern bei ihrer täglichen Arbeit Unterstützung bieten können? GitHub Copilot ist so eine Plattform, die speziell dafür entwickelt wurde, Entwicklern bei der Codeerstellung zu helfen – sie dient quasi als Assistent für Programmierer.

Beispiele für künstliche Intelligenz: GitHub Copilot
Beispiele für künstliche Intelligenz: GitHub Copilot

Während des Programmierprozesses bietet die App verschiedene Vorschläge an, wie Programmiercode automatisch vervollständigt werden kann, um die Effizienz und Rationalität des Entwicklungsprozesses zu verbessern. GitHub Copilot nutzt dabei die GPT-3-Technologie, dieselbe, die auch ChatGPT zugrunde liegt. Dieses KI-Modell ist jedoch speziell darauf ausgerichtet, sowohl menschliche als auch programmiertechnische Sprache zu interpretieren und zu erzeugen.

Aktuell erscheint es so, dass die Anwendung nicht über die Funktionen eines grundlegenden Assistenten hinausgeht und noch nicht fähig ist, komplexe Systeme autonom zu handhaben. Es bleibt spannend, ob sie sich in der Zukunft durchsetzen wird.

Sie können GitHub Copilot hier testen.

Zusammenfassend lässt sich sagen, dass GitHub Copilot:

  • Ein künstliche Intelligenz-basierter Assistent zur Unterstützung bei der Codeerstellung ist
  • Sowohl menschliche Sprache als auch Programmiercodes versteht und generiert
  • Derzeit anscheinend noch nicht in der Lage ist, komplexe Systeme eigenständig zu bearbeiten.

Haben Sie bereits Erfahrungen mit einer dieser KI-basierten Anwendungen gemacht? Wie beurteilen Sie diese ersten Eindrücke?