Treffen Sie Lamarr auf der CVPR 2024

Die IEEE / CVF Computer Vision and Pattern Recognition Conference (CVPR) ist die führende jährliche Veranstaltung im Bereich der Computer Vision und umfasst die Hauptkonferenz sowie mehrere begleitende Workshops und Kurzkurse. Sie bietet Studenten, Akademikern und Forschern aus der Industrie einen außergewöhnlichen Wert. Das Lamarr-Institut wird durch zwei herausragende Workshops vertreten, bei denen unsere Principal Investigators Prof. Dr. Jürgen Gall und Prof. Dr. Hildegard Kühne als Co-Organisatoren fungieren.

Workshop von Prof. Dr. Jürgen Gall: „Fifth International Workshop on Large Scale Holistic Video Understanding“

In den letzten Jahren hat sich die Fähigkeit von Computersystemen zur Klassifizierung und Analyse von Online-Videos erheblich verbessert. Bedeutende Fortschritte wurden bei spezifischen Videoerkennungsaufgaben, wie der Erkennung von Aktionen und Szenen, erzielt. Die umfassende Videoanalyse, bekannt als ganzheitliches Videoverstehen (HVU), hat jedoch nicht die Aufmerksamkeit erhalten, die sie verdient. Dieser Workshop widmet sich dem HVU, das das Erkennen von Szenen, Objekten, Aktionen, Attributen und Ereignissen in realen Videos umfasst. Wir stellen unser HVU-Dataset vor, das hierarchisch mit einer semantischen Taxonomie für ein ganzheitliches Videoverstehen organisiert ist. Unser Ziel ist es, einen umfassenden Videobenchmark zu schaffen, der die Erkennung aller semantischen Konzepte integriert und die Forschung in diesem Bereich vorantreibt.

Der Workshop wird durch Keynotes von renommierten Sprechern von Meta, NUS, Microsoft und dem UVA Deep Vision Lab abgerundet.

Workshop von Prof. Dr. Hildegard Kühne: „MMFM2: The 2nd Workshop on What is Next in Multimodal Foundation Models?“

Multimodale Foundation Models (MMFMs) haben in vielen Aufgaben der Computer Vision beispiellose Leistungen gezeigt. Bei spezifischen Aufgaben wie dem Verständnis von Dokumentenbildern sind ihre Leistungen jedoch noch unzureichend. Um diese starken multimodalen Modelle für die Aufgabe des Dokumentenbildverständnisses zu evaluieren und zu verbessern, nutzen wir eine große Menge öffentlich verfügbarer und privat gesammelter Daten und schlagen eine Herausforderung vor.

Der Workshop wird durch Keynotes von renommierten Sprechern von UW Madison, Google AI und MIT EECS sowie eine Podiumsdiskussion abgerundet.

Details

Datum

17. - 21. Juni 2024

Ort

Seattle Convention Center

Lamarr Events Fair - Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)

Weitere Veranstaltungen