Einer unserer Experten zeigt Dir in einer live Demo wie wir künstliche Intelligenz zum effektiven Content-Management einsetzen.
Was ist KI? – Entwicklung & Aufstieg
Von Künstlicher Intelligenz (KI) spricht man bereits seit über 50 Jahren. Gemeint war damit zunächst, dass Computer Arbeiten und Entscheidungen von Menschen übernehmen können. Es handelte sich also zunächst um eine algorithmische Intelligenz. Es ging darum, Daten zu analysieren und Entscheidungen zu verbessern. Bei Bildern und der Bilderkennung geht es darum, Muster zu erkennen. Das Europaparlament definiert Künstliche Intelligenz so: „Künstliche Intelligenz ist die Fähigkeit einer Maschine, menschliche Fähigkeiten wie logisches Denken, Lernen, Planen und Kreativität zu imitieren.“ Dabei unterschiedet die Institution zwischen Software und eingebetteter Intelligenz. Bei der Software werden virtuelle Assistenten, Bildanalysesoftware, Suchmaschinen, Sprach- und Gesichtserkennungssysteme genannt. Im Bereich „embedded“ geht es um Roboter, autonome Pkw, Drohnen, Anwendungen des „Internets der Dinge“.
In unserem Wiki haben wir Künstliche Intelligenz / Artificial Intelligence noch ausführlicher beleuchtet.
Es gibt derzeit – in der Folge des Entwicklungsschubs durch Chat-GPT3 – enorm viele Studien, die mögliche Veränderungen antizipieren. Die Autorinnen und Autoren einer McKinsey-Studie zu KI schreiben, dass Generative AI drei Viertel des geschätzten Produktivitätswachstums die Bereiche Kundenservice, Marketing, Vertrieb, Softwareentwicklung sowie Forschung und Entwicklung ausmachen werden.
Genau damit beschäftigen wir uns bei der EIKONA Media auch: Wie kannst Du produktiver arbeiten, indem wir Elemente der Künstlichen Intelligenz in unser TESSA DAM integrieren.
Welche KI setzt ein DAM ein?
Eine DAM-Software dient dem Management von Assets – Bildern, Grafiken, Dokumenten und anderen Arten von Dateien. Dateien werden in ein DAM integriert, im DAM verarbeitet und in nachfolgenden Prozessen möglichst automatisiert platziert. Um dies zu leisten, werden die Dateien mit einfacheren und komplexeren Algorithmen analysiert. Im einfachen Fall sind es Metadaten, die aus der Datei herausgelesen werden, um diese später suchbar zu machen. Außerdem können Elemente oder Muster erkannt oder Dateien transformiert werden. Schauen wir uns das im Einzelnen an:
Meta-Daten
Der Begriff „Meta“ stammt aus dem Griechischen und bedeutet „über“. Metadaten sind also Daten über Daten. Diese Metadaten bestimmen die Eigenschaften eines Datenobjekts. Im Falle des Digital Asset Managements (DAM) die Eigenschaften eines Assets – also einer Datei. Wir benutzen dabei Daten, die
- in der Datei enthalten sind
- durch die Abspeicherung im DAM entstehen
- manuell hinzugefügt werden
- durch Künstliche Intelligenz ermittelt werden oder
- aus der Verknüpfung mit einem PIM-System stammen.
Genauer erklären wir den Umgang mit Meta-Daten in unserem Wiki.
Objekterkennung & Tagging
Was schon weit über die Extraktion von Daten aus einer Datei hinausgeht, ist die Erkennung von Objekten. Dabei geht es um Muster, die in einer Grafikdatei erkannt werden und denen über den Vorgang des Erkennens ein oder mehrere Tags zugeordnet werden. Ursprünglich kommen die Grundlagen dieses Verfahrens aus dem Bereich Robotik. Dort muss ein Roboter beispielsweise erkennen, wo er eine Schweißnaht setzen muss. Aus Krimis weißt Du wahrscheinlich, dass es so etwas wie Gesichtserkennung gibt. Das war ein erstes Einsatzfeld der Objekterkennung im professionellen Umgang mit Bildern und der automatischen Objekterkennung durch Künstliche Intelligenz. Später mussten die großen sozialen Netzwerke Filter einbauen, um beispielsweise sexuelle Darstellungen oder Darstellungen von Gewalt filtern zu können. Der Einsatz von Menschen wäre bei der Menge der Daten nicht schnell genug, also musste die KI diese Aufgaben übernehmen. So können wir jetzt Tools einsetzen, die Objekte auf Fotos erkennen, wir können erkennen, welche Tiere auf einem Foto zu sehen sind, welche Jahreszeit gerade herrscht und noch vieles mehr. Die erkannten Objekte werden in Tags übersetzt und damit für Dich im DAM suchbar gemacht. Wir stützen uns dabei auf die Objekt-Erkennung von Google. Auch hier haben wir schon an anderer Stelle ein Beispiel für die Verschlagwortung mit der Google Cloud Visions API erläutert. Im TESSA DAM kannst Du dann nach automatisch verschlagworteten Action-, Mood- oder Ambientefotos suchen. Der Vorteil dabei: Die KI erledigt die Aufgabe sehr viel umfangreicher und genauer als der Mensch.
Automatisches Zuschneiden & Platzieren
Wenn Du Händler bist, kennst Du die Herausforderung wahrscheinlich: Hersteller schicken Dir Produktfotos mit unterschiedlich großem Weißraum. Was bei einem einzelnen Foto und auf einer Produktdetailseite nicht so tragisch ist, wirkt auf Produktübersichtsseiten unschön, weil die dargestellten Objekte – Kleidung, Elektronik, Fahrzeuge etc. – ungleichmäßig dargestellt werden. Der Aufwand jedes Foto einzeln anzufassen, um diese Misslichkeit zu beheben, wäre enorm. Deshalb haben wir für unser TESSA DAM einen Auto Crop entwickelt – einen Algorithmus, der den Bildrahmen automatisch in dem Abstand setzt, den Du Dir wünschst. Du musst uns nur noch den Abstand vom Bildrand oder die gewünschte Position nennen. Was wir außerdem in diesem Prozess können: andere Grafiken platzieren oder Wasserzeichen in Deine Fotos integrieren.
Freistellen & Pfade
Wenn Du als E-Commerce-Händler mit etwas anderem als dem visuellen Standard – also dem weißen Hintergrund, auf dem die Ware platziert ist – arbeiten möchtest, ist dies eine Herausforderung. In diesem Fall benötigen die Fotos Freisteller, Pfade bzw. Alpha-Kanäle um das Objekt herum. In der Vergangenheit war dies aufwändig und Handarbeit, selbst wenn es mithilfe von Photoshop leichter wurde. Freisteller für richtig viele Produkte in Fotos zu integrieren war schwierig. Künstliche Intelligenz hilft auch an dieser Stelle. Die KI im TESSA DAM erkennt das Objekt und zaubert einen Freisteller in Deine Fotos, sodass Du die Ware vor beliebigen Hintergründen platzieren kannst. So hast Du hast durch KI ein Werkzeug in der Hand, mit dem Du kreativ arbeiten und Dich vom Wettbewerb abheben kannst.
Komprimierung & Größenanpassung
Da es sich hierbei um eine Basisanforderung an Grafiksoftware handelt, würden wir hier gar nicht von KI reden. Schauen wir jedoch auf die Definition des Europaparlaments, so sind die Algorithmen, die wir hierfür in das TESSA DAM integriert haben, Künstliche Intelligenz. Das TESSA DAM ist in der Lage, Assets zu komprimieren und über Kanäle in der Größe und Form auszuspielen, die Du forderst. Wichtig: Die Vergrößerung von Pixelgrafiken funktioniert nicht wirklich gut und ist auch mithilfe von KI nicht so stark möglich, wie es in Krimis oft gezeigt wird. Aber Verkleinern, etwas Vergrößern und Komprimieren ist mit dem TESSA DAM möglich.
Eine detaillierte KI-Funktionsübersicht im TESSA DAM bekommst Du hier.
Fazit
Künstliche Intelligenz schafft Produktivität
Das sagt auch die Studie von McKinsey. Genauso ist es im Bereich des Digital Asset Managements. Du kannst durch den Einsatz des TESSA DAM Funktionen abbilden, die ohne KI nicht effizient zu bewältigen wären – wie Objekte taggen, Assets leicht finden, freistellen oder Transformieren. Die KI übernimmt in diesem Fall ähnliche Aufgaben, wie es im Bereich der Fabrik-Automation Maschinen und Roboter seit 50 Jahren machen. Allerdings kommt auch im Bereich der visuellen Kommunikation die generative KI (KI, die neue Bilder und Filme kreiert) hinzu. Solche Aufgaben werden DAM-Systeme nicht selbst übernehmen können. Sie werden allerdings in der Lage sein, per API Basismaterial zur Verfügung zu stellen, die Maschine, die das visuelle Material generiert, zu steuern und die Ergebnisse strukturiert im DAM zugänglich zu machen.