Generative KI als Open Source: DeepSeek versus ChatGPT für Mensch-KI-Interaktion und generative Benutzerschnittstellen

Die rasante Entwicklung der künstlichen Intelligenz (KI) geht einher mit einer wachsenden Bedeutung von Open-Source-Modellen. Die jüngste Veröffentlichung von DeepSeek R1 stellt eine bemerkenswerte Entwicklung hin zu anpassbaren, unabhängigen und datenschutzfreundlichen KI-Lösungen dar. In der Abteilung Human-AI Interaction (HAI) am Fraunhofer IOSB untersuchen wir die Auswirkungen dieser Fortschritte auf alle Arten von KI-gesteuerten Anwendungen, z.B. Produktionsumgebungen oder Fahrzeuginnenräume (Autos, Lastwagen, etc.). Open-Source-Modelle verbessern lokale KI-Anwendungen und machen sie anpassungsfähiger, sicherer und effizienter.

Das Potenzial von Open Source-KI

Die Einführung von DeepSeek R1 und ähnlicher Modelle eröffnet neue Möglichkeiten für die Anwendung von KI. Im Gegensatz zu proprietären, cloudbasierten Modellen wie ChatGPT gibt uns Open-Source-KI die vollständige Kontrolle über die Modellanpassung und stellt sicher, dass sich unsere eingesetzte KI genau an die spezifischen Arbeitsabläufe und Umgebungen unserer Kunden anpasst. Diese Unabhängigkeit ist für Edge- und lokale KI-Lösungen von entscheidender Bedeutung, da sie es ermöglicht, dass KI-gesteuerte Anwendungen ohne Abhängigkeit von Cloud-Diensten funktionieren.

KI-Modelle können nun für spezifische Aufgaben wie Datenanalyse, Bilderkennung oder sogar Benutzeroberflächen fein abgestimmt werden. Maßgeschneiderte Lösungen, die genau den betrieblichen Anforderungen der Kunden entsprechen, sind nun in Reichweite. Darüber hinaus verbleiben sensible Daten in der lokalen Infrastruktur, wodurch die Einhaltung der GDPR- und Branchenvorschriften gewährleistet wird. Dank der Edge-KI-Funktionen können diese Modelle direkt auf eingebetteter Hardware ausgeführt werden, wodurch Latenzzeiten und die Abhängigkeit von externen Servern verringert werden.

Am Fraunhofer IOSB betreiben wir bereits unsere eigenen Prototypen lokal, z. B. in unserem Forschungsfahrzeug KALLE, einem automatisierten Mercedes EQS der Stufe 3, den wir für Datenerhebungen, Nutzerstudien, Technologieevaluierungen und die Entwicklung maßgeschneiderter KI-Innenraumsysteme nutzen.

GenUIn: Automatisch Generierte Benutzeroberflächen mit Generativer Open Source-KI

Ein Schlüssel zu adaptiven Benutzeroberflächen ist nicht nur die Erkennung des Kontexts und der Bedürfnisse des Benutzers, sondern auch die Anpassung von Assistenzfunktionen für eine intuitive Steuerung und einen Dialog. Letzteres wird durch den Einsatz generativer KI zur Erstellung von Generated User Interfaces (GenUIn) enorm verbessert – intelligente, adaptive Schnittstellen, die sich dynamisch an das Nutzerverhalten und den Kontext anpassen. Open-Source-KI, insbesondere multimodale Modelle wie DeepSeek R1, heben diese Anpassungsfähigkeit auf ein neues Niveau. Diese Technologie ermöglicht das Verstehen von multimodalen Eingaben, einschließlich Text, Sprache und Bildern, und erleichtert so die Entwicklung intuitiver Schnittstellen, die sich dynamisch an die Bedürfnisse des Benutzers anpassen. Im Gegensatz zu statischen Menüs passen sich KI-generierte Schnittstellen in Echtzeit an und passen Menüs, Hilfestellungen und UI-Komponenten an, um ein nahtloses Erlebnis zu gewährleisten. Diese Schnittstellen bieten auch personalisierte Unterstützung, die sich an individuelle Präferenzen anpasst und ein maßgeschneidertes Benutzererlebnis im Fahrzeug oder in der Industrie schafft. Ein Förderprojekt, in dem wir generative Nutzerschnittstellen entwickeln und evaluieren, ist SALSA. SALSA wird vom Bundesministerium für Wirtschaft und Klimaschutz (BMWK). Der Verbund unserer Kooperationspartner besteht aus Audi, MAN, Valeo, bast, CanControls, Elektrobit, Invensity, WIVW und vielen weiteren. Achten Sie auf der kommenden IAA und anderen Konferenzen und Ausstellungen auf unsere Demonstratoren und Ausstellungen. Wir haben spannende Themen vorbereitet!

Adaptive KI und die Nutzererwartung

Eine der größten Herausforderungen im Bereich der KI-gesteuerten Schnittstellen besteht darin, ein Gleichgewicht zwischen Anpassungsfähigkeit und Vorhersehbarkeit herzustellen. Die Nutzer haben den Wunsch nach intuitiven und dennoch dynamischen Schnittstellen geäußert, die hilfreiche Antworten liefern, ohne ein Gefühl der Unvorhersehbarkeit zu erzeugen. Open-Source-KI spielt eine zentrale Rolle bei der Verbesserung dieses Gleichgewichts, indem sie eine transparente Anpassung und iterative Verbesserungen ermöglicht.

Nehmen Sie unsere Fortschritte im Auto, wo wir unser Advanced Occupant Monitoring-System einsetzen, um dem Auto Augen zu verschaffen und die jeweilige Situation zwischen den Passagieren zu verstehen. KI-generierte Benutzeroberflächen haben das Potenzial, das Fahrerlebnis im Auto zu personalisieren, indem sie sich an die Fahrbedingungen, die Vorlieben der Fahrgäste und die Sensordaten in Echtzeit anpassen und so sicherstellen, dass die Interaktionen sowohl nahtlos als auch effektiv sind. Darüber hinaus können kontextabhängige Anpassungen der Benutzeroberfläche die Reisekrankheit mindern, indem sie die Bildschirmhelligkeit, die Anzeige von Inhalten und die Interaktionsmethoden anpassen. Gleichzeitig stellt die KI sicher, dass die Interaktionen sowohl vorhersehbar als auch anpassungsfähig bleiben und sich auf der Grundlage des Benutzerfeedbacks auf natürliche Weise weiterentwickeln, ohne unnötige Komplexität einzuführen. Möchten Sie mehr darüber erfahren? In unserer Veröffentlichung Activities that Correlate with Motion Sickness in Driving Cars – An International Online Survey beschreiben wir unsere beispielhafte Implementierung zur Erkennung von Bewegungskrankheit und Aktivitäten mit lokalen visuellen Sprachmodellen (VLM).

Sicherheit und Datenschutz: Die großen Vorteile von lokalen KI-Modellen

Im Kontext von Automobil- und Industrieanwendungen ist die Gewährleistung von Sicherheit und Zuverlässigkeit entscheidend. DeepSeek R1 und analoge Open-Source-Modelle bieten einen deutlichen Vorteil gegenüber API-basierten KI-Lösungen, indem sie sicherstellen, dass die Daten innerhalb der lokalen Grenzen des Systems bleiben. Die lokale und kontrollierte Ausführung von KI-Berechnungen eliminiert alle Sicherheitsrisiken, die mit Cloud-Abhängigkeiten verbunden sind, und gewährleistet so eine konsistente Systemverfügbarkeit, ohne dass eine Internetverbindung oder vertrauenswürdige Server von Drittanbietern erforderlich sind. Bleiben wir bei unserem Beispiel der Incabin-Überwachung und der Anpassung der Benutzeroberfläche: Der lokale Betrieb erfüllt alle strengen Datenschutzanforderungen der automobilen Sicherheits- und Cybersecurity-Standards – etwas, womit cloudbasierte Alternativen kaum mithalten können. Ein Teil unserer Forschung befasst sich mit der Frage, wie KI auf sichere Weise eingesetzt werden kann. Unser vom Bundesministerium für Bildung und Forschung gefördertes Forschungsprojekt Anymos befasst sich insbesondere mit dem Datenschutz beim Einsatz von KI-Systemen im Innenraum des Autos.

Zukunftsperspektiven: Open-Source-KI in Schnittstellen der nächsten Generation

Mit den Fortschritten der KI-Technologie werden Open-Source-Modelle für die Entwicklung multimodaler Schnittstellen der nächsten Generation unerlässlich. Unsere Abteilung für Mensch-KI-Interaktion ist bestrebt, diesen Wandel voranzutreiben, indem sie die multimodalen KI-Fähigkeiten ausbaut und Sprache, Sehen und sensorbasierte Eingaben integriert, um ganzheitliche KI-gesteuerte Interaktionen zu schaffen. Um die Zugänglichkeit dieser Schnittstellen über verschiedene Plattformen hinweg zu gewährleisten, optimieren die Forscher die KI für Geräte mit geringem Stromverbrauch und ermöglichen so den effizienten Betrieb von KI-Modellen auf Automobil- und Industriehardware. Durch die kontinuierliche Neudefinition der KI-gestützten Interaktion gestalten wir die Zukunft der KI-gesteuerten Benutzeroberfläche und stellen sicher, dass sich die Systeme im Einklang mit den Erwartungen der Nutzer weiterentwickeln.

Schlussfolgerung: Wir setzen auf Open Source-KI für menschenzentrierte Innovation

Das Aufkommen von DeepSeek R1 und ähnlicher Open-Source-KI-Modelle stellt einen entscheidenden Moment in der Entwicklung der KI-gesteuerten Interaktion dar. Indem wir diese Modelle nutzen, steht unsere Forschung an der Spitze der Entwicklung sicherer, effizienter und anpassungsfähiger KI-Anwendungen. Dies umfasst ein ganzes Spektrum von Innovationen, von der Erstellung von Benutzeroberflächen bis hin zu multimodaler KI-gesteuerter Automatisierung. Folglich legt Open-Source-KI den Grundstein für eine Zukunft, in der menschenzentrierte KI-Lösungen nicht nur reaktiv, sondern wirklich intelligent und kontextbewusst sind.

Haben wir Ihr Interesse geweckt und Sie haben noch Fragen? Oder haben Sie eine Projektidee, über die Sie unverbindlich mit uns sprechen möchten? Dann nehmen Sie gerne Kontakt mit uns auf.

Kommentar schreiben

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert