Ein Blick hinter die Kulissen

Wir nennen ihn liebevoll Nerd-Content - die spannenden, komplexen Themen, für die unsere Entwickler brennen - Features, die wir entwickelt, Erkenntnisse, die wir gewonnen oder Besonderheiten, die wir entdeckt haben. Viel Spaß beim Lesen!

Unsere Expertise liegt nicht nur darin, Magnolia zu implementieren, sondern es an die spezifischen Bedürfnisse unserer Kunden anzupassen und kontinuierlich weiterzuentwickeln. Diese Flexibilität ermöglicht es uns, innovative und effiziente Anwendungen zu schaffen, die unseren Kunden langfristig Mehrwert bieten."

Markus Hesper, Gesellschafter dev5310

GPT4 Image Recognizer innerhalb der Magnolia DXP

Verstärkung von Magnolias Bilderkennung mit AI

Das DEV5310 GPT-4 Vision Image Recognition Modul baut auf dem Magnolia CMS Image Recognition Modul auf und erweitert dessen Funktionalitäten durch die Integration mit dem GPT-4 Vision Modell von OpenAI. Das GPT-4 Vision Modell bietet eine verbesserte Genauigkeit und eine erweiterte Wissensbasis, die eine umfassende Bilderkennung ermöglicht.

Das Set-up

Bevor Sie mit dem dev5310-gpt4-vision-image-recognition Modul loslegen, müssen Sie sicherstellen, dass das Image Recognition Modul des Magnolia CMS installiert wurde. Dies dient als Basis, auf der das neue Modul funktioniert.

Sobald dies erledigt ist, müssen Sie, wie bei jedem typischen Modul-Setup, die Abhängigkeit dev5310-gpt4-vision-image-recognition in die Maven pom.xml-Datei aufnehmen. Anschließend wird Magnolia CMS so konfiguriert, dass es das neue Modul als zentralen Dienst für alle Bilderkennungsanforderungen erkennt.

Nutzung von OpenAIs Vision-Modell

Eines der Highlights des dev5310 GPT-4 Vision Image Recognition Moduls ist die Implementierung von OpenAIs GPT-4 Vision Modell. Das Modul kommuniziert nahtlos mit dem KI-Modell, um die eingegebenen Bilder mit relevanten Etiketten zu versehen. Für diese Interaktion mit OpenAI ist jedoch ein API-Schlüssel erforderlich, und die hier gebotene Flexibilität ist lobenswert. Egal, ob Sie den API-Schlüssel in einer Umgebungsvariablen, direkt in der Modulkonfiguration oder über die Magnolia-Passwörter-App speichern möchten – das Modul ist so konzipiert, dass es alle diese Methoden unterstützt. Es gewährleistet einen schlanken Einrichtungsprozess, unabhängig von der gewählten Methode.

Fazit

Zusammenfassend lässt sich sagen, dass das dev5310 GPT-4 Vision Image Recognition Modul eine bedeutende Erweiterung der in Magnolia CMS eingebauten Funktionalitäten darstellt. Durch die Integration mit der Leistung von OpenAIs GPT-4 bringt das Modul automatisierte und präzise Bilderkennung auf Ihre CMS-Plattform. Es ist einfach einzurichten, leicht zu konfigurieren und erweitert effektiv Ihre Bilderkennungsfähigkeiten. Machen Sie sich bereit, die Leistungsfähigkeit der KI-gestützten Bilderkennung wie nie zuvor zu entdecken!

Die dev5310Gpt4ImageRecogniser-Klasse

In der Welt der künstlichen Intelligenz dreht sich eines der Trendthemen um die Bilderkennung. Genauer gesagt, um das Modell, das OpenAI unter dem Namen GPT-4 Vision zur öffentlichen Nutzung bereitgestellt hat. In diesem Artikel soll die Klasse Dev5310Gpt4ImageRecogniser vorgestellt werden, die dieses Modell für die Bilderkennung nutzt.

Hier geht's zur Dokumentation

Wie funktioniert der dev5310Gpt4ImageRecogniser?

Der dev5310Gpt4ImageRecogniser implementiert die ImageRecogniser-Schnittstelle. Wie der Name schon sagt, hat ein ImageRecogniser die Aufgabe, Bilder zu interpretieren und ihre Kennzeichnungen (Tags) zurückzugeben. In dieser speziellen Implementierung übernimmt das GPT-4 Vision-Modell diese Arbeit.

java public class Dev5310Gpt4ImageRecogniser implements ImageRecogniser { ... }

Die Klasse verwendet einen JSON-String API_MESSAGE_BODY_TEMPLATE, um die Nutzlast für die OpenAI-API zu definieren. Die Nutzdaten enthalten Anweisungen für den Assistenten und ein zu taggendes Bild. Das Bild wird in Base64 kodiert und zusammen mit einer Anfrage zum Taggen des Bildes an den OpenAI-Bilderkennungsassistenten gesendet.

Eine Instanz von Dev5310OpenAICredentialsProvider wird in der Klasse eingerichtet, die für das Abrufen der erforderlichen Anmeldeinformationen für die Interaktion mit dem OpenAI-Dienst verantwortlich ist.

Bilderkennungsmethode

Die Kernfunktionalität von Dev5310Gpt4ImageRecogniser ist in seiner Erkennungsmethode gekapselt:

java @Override public Collection recognise(final byte[] imageBytes) {...}

Diese Funktion nimmt als Eingabe ein Byte-Array, das ein Bild darstellt, ruft die OpenAI-API auf und gibt eine Sammlung von ImageLabel-Objekten zurück, die die Tags für das erkannte Bild darstellen. ImageLabel"-Objekte sind im Wesentlichen Darstellungen der erkannten Beschriftungen des Bildes.

Falls der OpenAI-Dienst mit einem anderen HTTP-Statuscode als 200 antwortet, wird die Erkennung übersprungen und der Fehler protokolliert. Wenn die Antwort erfolgreich ist, wird ein GptResponse-Objekt erstellt, die Antwort geparst, in Tags umgewandelt und als Sammlung von ImageLabel-Objekten zurückgegeben.

Ergänzende Funktionalitäten

Neben der Erkennungsmethode verfügt die Klasse über mehrere Hilfsmethoden, die alle der Verarbeitung und Vorbereitung der Bilddaten dienen:

_
getBodyImageInfo: Führt vorläufige Bildprüfungen durch - ob das Bild erkannt wird, seinen Typ, seine Größe, seinen MIME-Typ - und erzeugt den Nachrichtentext für die OpenAI-API.
_
getBodyImageIO: Erzeugt eine base64-Darstellung des angegebenen Formats und der Abmessungen des Bildes.
_
scaleImageToFit: Diese Funktion wird verwendet, um die Größe des Bildes unter Beibehaltung des ursprünglichen Seitenverhältnisses zu ändern.

Diese Klasse bietet ein Beispiel für die Interaktion mit Bilderkennungsmodellen wie GPT-4 Vision, das von OpenAI bereitgestellt wird. Sie ist unkompliziert und bietet eine elegante Möglichkeit, mit einer Bildverarbeitungs-API zu kommunizieren, Bilder zu verarbeiten und ihre Bezeichnungen zurückzugeben.

Wissenswertes aus der Welt der dev Entwickler

Headless-Implementation - die Vorteile

Die Einführung einer Headless-Architektur für Content Management Systeme (CMS) wie z.B. Magnolia DXP bietet eine Vielzahl von Vorteilen für Unternehmen aller Größenordnungen. Bei einer Headless-Integration wird die Trennung von Inhaltserstellung und -präsentation ermöglicht, indem der Frontend-Bereich von der Backend-Logik entkoppelt wird.

Eine der Hauptvorteile einer Headless-Integration liegt in der Flexibilität und Skalierbarkeit. Durch die Entkopplung des Frontends können Inhalte omnichannel über verschiedene Kanäle und Endgeräte hinweg konsistent bereitgestellt werden - sei es auf Websites, mobilen Apps, für Digital Signage, auf IoT-Geräten oder anderen digitalen Plattformen. Dies ermöglicht es Unternehmen, ihre Präsenz zu erweitern und neue Zielgruppen zu erreichen und dabei die vom klassichen CMS bekannten Fatures auf ein anderes Level zu heben.

Neben der schnelleren Umsetzbarkeit von neuen Inhalten und Funktionen ist ein weiterer wichtiger Vorteil die verbesserte Performance und Sicherheit. Durch die Reduzierung von Overhead und die Fokussierung auf die Bereitstellung von reinem Content können Ladezeiten optimiert und Sicherheitsrisiken minimiert werden.

Insgesamt bietet eine Headless-Integration von CMS wie z.B. Magnolia DXP eine zukunftssichere Lösung, die Unternehmen dabei unterstützt, sich den Herausforderungen der Digitalen Transformation zu stellen.

Der Weg vom CMS zur DXP Lösung

Mit dem Aufkommen der 𝗗𝗶𝗴𝗶𝘁𝗮𝗹 𝗘𝘅𝗽𝗲𝗿𝗶𝗲𝗻𝗰𝗲 𝗣𝗹𝗮𝘁𝗳𝗼𝗿𝗺𝘀 eröffnen sich neue Horizonte für Unternehmen. Eine 𝗗𝗫𝗣 integriert nicht nur Content Management, sondern auch Funktionen wie Datenanalyse, Personalisierung, Echtzeit-Marketing und mehr. Sie bietet eine ganzheitliche Lösung, um ein reichhaltiges und ansprechendes Online-Erlebnis zu schaffen, das weit über die einfache Contentverwaltung hinausgeht.

𝗩𝗼𝗿𝘁𝗲𝗶𝗹𝗲 des Umstiegs auf eine DXP:

𝗣𝗲𝗿𝘀𝗼𝗻𝗮𝗹𝗶𝘀𝗶𝗲𝗿𝘂𝗻𝗴 Gezielte Inhaltsanpassung für individuelle Benutzerpräferenzen.
𝗘𝗰𝗵𝘁𝘇𝗲𝗶𝘁-𝗜𝗻𝘁𝗲𝗿𝗮𝗸𝘁𝗶𝗼𝗻𝗲𝗻 Schnelle Reaktion auf Benutzerinteraktionen und Bereitstellung personalisierter Angebote.
𝗠𝗲𝗵𝗿𝗳𝗮𝗰𝗵𝗸𝗮𝗻𝗮𝗹-𝗨𝗻𝘁𝗲𝗿𝘀𝘁ü𝘁𝘇𝘂𝗻𝗴 Konsistente Inhaltsbereitstellung über verschiedene Kanäle.
𝗜𝗻𝘁𝗲𝗴𝗿𝗮𝘁𝗶𝗼𝗻 𝘃𝗼𝗻 𝗗𝗿𝗶𝘁𝘁𝗮𝗻𝗯𝗶𝗲𝘁𝗲𝗿𝗱𝗶𝗲𝗻𝘀𝘁𝗲𝗻 Nahtlose Integration für eine verbesserte User Experience.

Wie integriert man eine DXP-Lösung in eine bestehende Systemlandschaft?

Die Integration einer Digital Experience Platform (DXP) in die bestehende Systemlandschaft birgt sowohl Chancen als auch Risiken. Technische Herausforderungen wie Dateninkonsistenzen, Performance-Engpässe und Sicherheitsrisiken können auftreten. Die DXP bietet aber gleichzeitig eine effektive Möglichkeit zur Konsolidierung digitaler Datenpools, zur Implementierung fortschrittlicher Analyse- und Personalisierungsfunktionen sowie insgesamt zur Verbesserung des Kundenerlebnisses.

Eine DXP ermöglicht eine nahtlose Integration in vorhandene Systeme und schafft eine skalierbare Architektur. Durch die Nutzung moderner Integrationsprotokolle und APIs werden Datenflüsse optimiert und Redundanzen minimiert. Darüber hinaus ermöglicht die DXP eine effiziente Verwaltung von Content und Assets über verschiedene Plattformen hinweg.

Insgesamt ist die Integration einer DXP eine strategische Investition, die langfristige Vorteile bietet. Wir helfen euch gern dabei, die Chancen einer Integration voll auszunutzen und die Herausforderungen entspannt zu bewältigen.

Neues aus der Magnolia Welt

Content-Driven Commerce

Die meisten E-Commerce-Systeme zeichnen sich durch die Verwaltung von Produktdaten und die Erfassung von Transaktionen aus. Die Bereitstellung dynamischer, personalisierter Erlebnisse für den modernen Kunden ist immer noch die Domäne von Content-Management-Lösungen.
Magnolia hilft Ihnen, harmonische Multi-Channel-Einkaufserlebnisse zu schaffen - von der Produktbeschreibung bis zum Check-out - von einer einheitlichen Plattform oder einem DXP-System aus.

https://www.magnolia-cms.com/platform/solutions/ecommerce.html

AI Accelerator

Da AI immer leistungsfähiger wird, machen wir es digitalen Teams leicht, alle Tools zu nutzen, die ihnen helfen, schnell herausragende Inhalte zu erstellen und sie in ihre normalen Arbeitsabläufe einzubinden. Magnolias AI Accelerator unterstützt Verbindungen zu beliebigen generativen AI-Engines,, z.B. um die Erstellung von Inhalten zu beschleunigen.

https://www.magnolia-cms.com/platform/solutions/ai-accelerator.html

Magnolia PaaS

Spätestens beim Wechsel auf eine neuere Version oder bei der Lizenzverlängerung empfiehlt sich ein Blick auf die Frage nach dem Wechsel auf die Magnolia Cloud Version (PaaS), die allen Magnolia Kunden zur Verfügung steht und viele Vorteile, wie z.B. flexiblere, regionsübergreifende Deployments, bietet.

https://www.magnolia-cms.com/platform/architecture-and-tech-stack/platform-as-a-service.html