Das Stanford Institute for Human-Centered Artificial Intelligence (HAI) hat die neueste Ausgabe seines jährlichen Berichts über die Auswirkungen und Fortschritte von KI veröffentlicht. Erkunden Sie den vollständigen Bericht auf der HAI-Website. Rückblickend auf das Jahr 2020 stellen sie fest, dass:
Stanford aktualisierte auch ihr Global AI Vibrancy Tool mit interaktiven Visualisierungen, die einen länderübergreifenden Vergleich für bis zu 26 Länder in den Bereichen KI-Forschung, Wirtschaft und Inklusion ermöglichen.
"Vor fünfzehn Jahren entdeckten [Neurowissenschaftler], dass das menschliche Gehirn über multimodale Neuronen verfügt. Diese Neuronen reagieren auf Cluster von abstrakten Konzepten, die sich um ein gemeinsames übergeordnetes Thema drehen, und nicht auf ein bestimmtes visuelles Merkmal. Das berühmteste dieser Neuronen war das "Halle Berry"-Neuron, ein Neuron - über das sowohl im Scientific American als auch in der New York Times berichtet wurde - das auf Fotos, Skizzen und den Text "Halle Berry" (aber nicht auf andere Namen) reagiert. CLIP hat diese multimodalen Neuronen auch!"
In der Januar Ausgabe des Newsletters haben wir auf die Bedeutung von OpenAIs CLIP hingewiesen. Das Forscherteam hat nun seine detaillierte Zerlegung des Modells veröffentlicht und präsentiert ein Spider-Man Neuron, das auf Bilder einer Spinne, ein Bild des Textes "Spinne" und die Comic-Figur "Spider-Man" sowohl im Kostüm als auch illustriert reagiert. Lesen Sie mehr auf dem OpenAI Blog.
🎨 1. ML Art - BigGAN von Google DeepMind kann 'realistische' Bilder aus zufälligem Rauschen erzeugen. OpenAIs CLIP hingegen ist perfekt, um ein Bild mit gegebenen Textbeschreibungen abzugleichen. Im Januar kombinierte Ryan Murdock, ein Doktorand aus Utah, CLIP mit BigGAN, um einen Text-zu-Bild-Generator namens The Big Sleep zu erstellen. Das System iteriert durch die von BigGAN generierten Bilder und versucht, das CLIP-Scoring mit einer gegebenen Textbeschreibung zu optimieren.
Der Autor hat ein Colab Notebook mit einer Code-Implementierung veröffentlicht, so dass Sie es selbst ausprobieren können.
Nur wenige Tage später wurde Big Sleep zu einem Poem-to-Video-Generator operationalisiert. Will Stedden veröffentlichte Story2Hallucination, das mehrere Bilder auf Basis einer Reihe von Beschreibungen erzeugt. Indem er das System mit Gedichten fütterte, erzeugte er hypnotisierende Visualisierungen zu den Werken des Dichters William Wordsworths (siehe verlinktes Video unten). Andere haben Story2Hallucination benutzt, um Musikvideos ihrer Lieblingsacts zu erstellen, wie z.B. dem kürzlich aufgelöstem DJ Duo Daft Punk. Probieren Sie es selbst mit diesem Colab Notebook.
🗞 2. News - ICLR, eine der wichtigsten KI-Konferenzen, hat die erste Liste der eingeladenen Sprecher veröffentlicht. Unter ihnen ist Timnit Gebru, die kürzlich von Google gefeuert wurde, weil sie Diskriminierungsprobleme angesprochen hatte. Die Liste der Redner finden Sie im ICLR-Blog.
📄 3. Paper - Eine aktuelle Studie von Google-Forschern verglich Transformers Modifikationen mit dem Original von 2017. In ihrem Paper mit dem Titel "Do Transformer Modifications Transfer Across Implementations and Applications?" (arXiv) stellen sie fest, dass "überraschenderweise [...] die meisten Modifikationen die Transformer Performanz nicht signifikant verbessern". Lesen Sie eine Zusammenfassung der Studie auf Synced.
💙 4. We are Hiring! - Wir sind auf der Suche nach deutschsprachigen Data Engineers. Schauen Sie sich die Positionen in unserem Enterprise AI Team auf der AMAI Karriereseite an.
💡 5. Use Case - MyHeritage, eine Online-Plattforn zur Ahnenforschung, hat alte Familienfotos wieder zum Leben erweckt. Tausende von Nutzern nutzten DeepNostalgia, um alte Schwarz-Weiß-Fotos der Urgroßeltern in lebendige Fotos zu verwandeln. Ein hervorragender Marketing-Stunt, der MyHeritage sicherlich viel Publicity einbrachte. Unter dem Twitter-Hashtag #DeepNostalgia finden Sie beeindruckende Ergebnisse und erstaunte Nutzerreaktionen. Die Technologie wurde von der KI-Gesichtsplattform von D-ID bereitgestellt, die in ihrem Blog näher darauf eingehen.
🎙 6. Interview - DeepMind Software Engineer Julian Schrittweiser is im Stack Overflow-Podcast zu Besuch, um über das MuZero Paper zu sprechen und über das woran das DeepMind Labor als nächstes arbeitet. Hören Sie auf dem Stackoverflow Blog rein.
👁 7. Verschiedenes - Im Subreddit r/MachineLearning wurde kürzlich über nicht reproduzierbare Forschungsarbeiten diskutiert. Ein Forscher beschwerte sich, dass mehrere seiner Versuche, Ergebnisse aus prominenten Machine-Learning-Papern zu reproduzieren, fehlgeschlagen waren. Andere auf der Plattform teilten daraufhin ähnliche Geschichten und posteten weitere solche Arbeiten.
Tage später veröffentlichte das ursprüngliche Redditor ContributionSecure14 Papers Without Code, um eine zentralisierte Liste von Arbeiten zu sammeln, die andere Forscher nicht reproduzieren konnten. Während einige Autoren ihre Code-Implementierungen aus triftigen Gründen zurückhalten, wie z.B. zum Schutz von Benutzerdaten oder geistigem Eigentum, will Papers Without Code Forschern Zeit sparen und nicht reproduzierbare Arbeiten disinzentivieren. Lesen Sie mehr auf The Next Web.
📄 8. Papier - Derzeit benötigen Bilderkennungssysteme große Mengen an beschrifteten Bildern. Facebooks AI-Chefwissenschaftler Yann LeCun hofft, dass "langfristig der Fortschritt in der KI von Programmen kommen wird, die einfach den ganzen Tag Videos anschauen und wie ein Baby lernen." Mit einem neuen Ansatz namens SEER, kurz für SElf-supERvised, will Facebook eine "Neue Ära für Computer Vision" einleiten.
Lesen Sie mehr auf WIRED und im Facebook AI Blog. Das Paper "Self-supervised Pretraining of Visual Features in the Wild" ist auf arXiv verfügbar.
🇩🇪 March 25 (online, 10:00 CET) – Fallbeispiel einer KI im Mittelstand:
KI Lab Nordschwarzwald - Unternehmensinterne Suchmaschine -
Die Menge der unternehmensinternen Daten wächst täglich. Mitarbeiter verbringen viele unnötige Minuten damit, Vorgänge, Betriebsanleitungen, Bedienanweisungen, Prozessdokumentationen, Kundenspezifika oder ähnliche Informationen in den unternehmenseigenen Ablagesystemen zu suchen.
Die Ineffizienz bei der Suche nach relevanten Informationen nimmt dabei stetig mit der Datenmenge zu. Wie man hier Abhilfe schaffen kann, zeigt Ihnen Woldemar Metzler von der AMAI GmbH anhand konkreter Anwendungsbeispiele von unternehmensinternen Suchmaschinen.
Ein solches Projekt bietet oft einen perfekten Einstieg in die Welt der KI – gerade auch für KMU, da der Umsetzungsaufwand überschaubar und die Ergebnisse überzeugend sind. – Registrieren Sie sich hier Sie auf podio.com.
📅 12. April (online, 16:30 Uhr MEZ) - NVIDIA CEO & Godfathers of AI
Zum Auftakt der GTC-Konferenz (12.-16. April) lädt Nvidia-Gründer Jensen Huang Yoshua Bengio, Geoffrey Hinton und Yann LeCun zu einer gemeinsamen Keynote ein. Die Registrierung ist kostenlos und wird nicht benötigt, um die Keynote zu sehen. - Der Livestream wird auf nvidia.com verfügbar sein.