DIE TECHNIKEN DES 3D-SENSING IM DETAIL

Coherent ist der führende Anbieter von fortschrittlichen Lösungen für 3D-Sensing-Anwendungen.

 

22. Mai 2024 von Coherent

Unsere Welt hat drei Dimensionen. Diese Aussage ist so offensichtlich, dass die meisten von uns nie darüber nachdenken, wie wir sie eigentlich wahrnehmen. Denn tatsächlich erfasst jedes unserer Augen nur ein 2D-Bild – genau wie eine Kamera. Und erst in unserem Gehirn findet die Magie statt, die aus diesen beiden flachen Bildern unsere dreidimensionale Wahrnehmung erschafft. 

In der heutigen Zeit suchen Unternehmen zunehmend nach Möglichkeiten, digitale Systeme mit der 3D-Welt interagieren zu lassen – ob es darum geht, Gestenbefehle zu interpretieren, Gesichter zu erkennen oder ein Fahrzeug im Autopilot fahren zu lassen. Hierfür müssen wir ihnen aber die Möglichkeit verleihen, zumindest einen Teil unserer Fähigkeit zur Tiefenwahrnehmung zu replizieren. 

 

Tiefensensorik

In der digitalen Bildverarbeitung gibt es zwei grundlegende Ansätze, um eine Wahrnehmung in drei Dimensionen (und somit von räumlicher Tiefe) zu ermöglichen: Triangulation und Time-of-Flight (ToF, zu Deutsch hier: „Lichtlaufzeit“). Manchmal werden diese Techniken sogar miteinander kombiniert.  

Die Triangulation basiert auf geometrischen Messungen. Eine bestimmte Art der Triangulation – das binokulare Sehen – entspricht dem, was das menschliche Gehirn durchführt, um eine stereoskopische 3D-Sicht auf die Welt zu erhalten. Wir besitzen zwei Augen, die horizontal nebeneinander liegen. Das bedeutet, dass jedes Auge die Welt aus einem leicht anderen Winkel sieht. Die Differenz zwischen den beiden Perspektiven führt – je nachdem, mit welchem Auge man sieht – zu einer Parallaxe, also einem unterschiedlichen Standort von Objekten relativ zu ihrem Hintergrund. Unser Gehirn berechnet aus diesen Parallaxeninformationen dann die Tiefe der Objekte in unserem Sichtfeld (also unsere Distanz zu ihnen) und generiert so unsere kombinierte 3D-Wahrnehmung der Außenwelt. 

Aber die Fähigkeit zum binokularen Sehen, auch als Stereosehen bezeichnet, kann von den herrschenden Lichtbedingungen abhängig sein und benötigt texturierte Oberflächen. Dadurch ist sie nur schwer praktikabel einsetzbar. Stattdessen verwenden Computer-Vision-Systeme eine andere Form der Triangulation, die auf „strukturiertem Licht“ basiert. Das ist einfach nur ein eindrucksvoller Name dafür, dass man ein Muster (wie eine Reihe von Linien oder mehrere Lichtpunkte) auf ein Objekt projiziert und dann die Verzerrung dieses Musters aus einem leicht anderen Blickwinkel analysiert. Hierfür ist weitaus weniger Rechenleistung notwendig als für eine Nachbildung des echten binokularen Sehens. Zudem kann ein Computer rasend schnell die Tiefeninformationen berechnen und eine 3D-Szene rekonstruieren.

 

Bei einer Form der Tiefenwahrnehmung durch Triangulation wird ein strukturiertes Lichtmuster auf die Szene projiziert, woraufhin ein Bildverarbeitungssystem die Verzerrung dieses Musters analysiert, um Tiefeninformationen für den beleuchteten Bereich zu erhalten.

 

Triangulationsmethoden sind bei der hochauflösenden Kartierung von Oberflächen unübertroffen. Sie erzielen ihre besten Ergebnisse über kürzere Distanzen, wodurch sie sich gut für Aufgaben wie Gesichtserkennung eignen. 

Auch die Time-of-Flight-Bildverarbeitung (ToF) kann zwei verschiedene Formen annehmen. Bei der direkten Messung der Lichtlaufzeit (auch als „Direct Time-of-Flight“ oder „dToF“ bezeichnet) wird die Szene mit Lichtimpulsen beschossen und das System misst, wie viel Zeit bis zur Rückkehr dieser reflektierten Impulse verstreicht. Da wir die Lichtgeschwindigkeit kennen, können wir aus diesem Zeitwert direkt die Entfernung ableiten. Wenn diese Berechnung für jedes Pixel in einem Bild unabhängig durchgeführt wird, kann für jeden Punkt in der Szene ein Tiefenwert abgeleitet werden. 

Die zweite ToF-Technik verwendet indirekte Messungen der Lichtlaufzeit und nennt sich entsprechend „Indirect Time-of-Flight“ oder kurz „iToF“. Hierbei besteht die Beleuchtung aus einem kontinuierlichen, modulierten Signal. Das System misst die Phasenverschiebung dieser Modulation in zurückgekehrten Lichtstrahlen. Mithilfe dieser Daten kann daraufhin die Entfernung zu Objekten berechnet werden. 

ToF-Techniken sind besonders gut darin, größere Bereiche und Entfernungen schnell zu vermessen. Dadurch eignen sie sich beispielsweise sehr gut, um mit einem Virtual-Reality-Headset einen Raum zu scannen, oder auch für die Hinderniserkennung in der Roboternavigation.

 

Bei der Tiefenberechnung mittels dToF wird die Roundtrip-Laufzeit des Lichtimpulses gemessen und die Zeitintervalle werden in Distanzwerte umgerechnet.

 

Anforderungen an Lichtquellen für 3D-Sensing

Für ein effektives und präzises 3D-Sensing sind sowohl bei der Triangulation aus auch mit der ToF-Technik die Eigenschaften der Lichtquelle von entscheidender Bedeutung. Jeder Einsatzzweck stellt zwar seine eigenen, einzigartigen Beleuchtungsanforderungen, es gibt jedoch auch einige Grundbedürfnisse, die überall gleich sind. 

Triangulation profitiert von einer kohärenten Lichtquelle. Diese bietet mehr Flexibilität bei den einsetzbaren Mustern. Zudem ermöglicht sie die Bildung höheraufgelöster Strukturmuster und die Wahrung der Musterintegrität über längere Strecken. 

Eine Lichtquelle für die Triangulation muss zudem einen stabilen Strahlpunkt erzeugen können. Jegliche Schwankungen dieses Strahlpunkts können die Ergebnisse der Tiefenmessung verfälschen. 

Eine Lichtquelle für ToF-Systeme muss entweder kurze, präzise Lichtimpulse ausstrahlen können (dToF), oder aber kontinuierliches Licht, das bei hohen Frequenzen moduliert werden kann (iToF). Die zeitliche Präzision der Impulse und die Modulationsfrequenz mit kurzen Anstiegs- und Abfallzeiten ist entscheidend für eine korrekte Entfernungsmessung.

Für ToF-Systeme – und darunter insbesondere für diejenigen, die mithilfe von Flood-Beleuchtung große Flächen oder Entfernungen abdecken – sind generell höhere Ausgangsleistungen nötig als für Triangulationssysteme. Dadurch wird sichergestellt, dass das zurückkommende Licht eine ausreichende Intensität hat, um erkannt zu werden, und dass das System auch bei starkem Umgebungslicht gut funktioniert. 

Mit höheren Ausgangsleistungen gewinnt auch die Energieeffizienz (das Verhältnis der optischen Ausgangsleistung zur elektrischen Eingangsleistung) an Bedeutung. Effizienz wird insbesondere für tragbare (batteriebetriebene) Systeme zum kritischen Faktor.

 

Laser für bessere Tiefensensorik

Diodenlaser erfüllen diese Anforderungen (sowohl für die Triangulation als auch für ToF-Messungen) besser als jede andere Lichtquelle. In der Vergangenheit wurden für einige Anwendungen im Bereich des 3D-Sensing lichtemittierende Dioden (LEDs) eingesetzt, da sie einfach erhältlich und relativ kostengünstig sind. Aber bei den zunehmenden Forderungen nach höherer Leistung und Effizienz für 3D-Sensing-Systeme können LEDs nicht mehr mithalten. 

Ein Grund dafür ist, dass Diodenlaser eine einzigartige Kombination aus engem Lichtspektrum, Kohärenz und Helligkeit bieten. Diese Kombination macht sie zur idealen Lichtquelle für präzise, kontrastreiche und stabile strukturierte Lichtmuster.  

Durch das enge Lichtspektrum eines Lasers wird es zudem sehr viel leichter, Umgebungslicht im Messsystem herauszufiltern. So kann mit allen Arten von Sensoriksystemen auch in hellem Sonnenlicht oder anderen gut beleuchteten Szenen eine höhere Leistung erzielt werden. 

Außerdem wird durch die helleren Diodenlaser auch das Rücklaufsignal stärker. Insbesondere bei ToF-Anwendungen ermöglicht das kürzere Belichtungszeiten, höhere Bildraten und es steigert die Sichtbarkeit von Objekten, die nicht stark reflektieren, sowie eine bessere Leistung bei hellen Lichtverhältnissen. LEDs tun sich aufgrund ihrer niedrigeren Intensität schwer dabei, denselben Detailgrad und ebenso hohe Auflösungen zu erreichen.

Diodenlaser haben auch bei Stromverbrauch und Größe einen deutlichen Vorteil gegenüber LEDs. Da sie aber trotz ihrer geringen Größe ein starkes Signal aussenden können, eignen sie sich ideal für kompakte, batteriebetriebene Geräte. 

Und zu guter Letzt können Diodenlaser auch noch mit sehr viel höherer Geschwindigkeit ein- und ausgeschaltet oder moduliert werden als LEDs. Ihre schnelle Modulation ermöglicht fortschrittlichere ToF-Techniken, mit denen eine höhere Präzision erzielt werden kann. 

 

Coherent glänzt beim 3D-Sensing

Coherent ist der Weltmarktführer für Lichtquellen auf dem Gebiet des 3D-Sening – mit mehr als 2 Milliarden verkauften Einheiten. Unser Produktportfolio reicht von Lasern über Optiken bis hin zu vollständigen Beleuchtungsmodulen. 

Unser Angebot an Lichtquellen umfasst Vertical Cavity Surface Emitting Laser (VCSELs), VCSEL-Arrays und kantenemittierende Diodenlaser (Edge-emitting Diode Lasers, EELs)

Insbesondere VCSEL-Arrays – üblicherweise mit der Ausgangswellenlänge 940 nm – sind zur dominierenden Lichtquelle für modernes 3D-Sensing geworden. Hierfür gibt es mehrere Gründe. Erstens verlässt das Lichtsignal von VCSELs das Gerät an der Oberseite statt an der Seite wie bei einem EEL. Dadurch lassen sie sich leichter auf einem Schaltkreis mit anderen Komponenten integrieren. Zudem sind auf den für 3D-Sensing erforderlichen Leistungsniveaus VCSELs günstiger als EELs. So werden EELs typischerweise nur für längere Wellenlängen (>1.200 nm) eingesetzt, für die noch keine leistungsfähigen VCSELs verfügbar sind. Der zentrale Vorteil dieser längeren Wellenlängen ist, dass sie in hellem Sonnenlicht stabilere Ergebnisse erzielen (denn beinahe alles Sonnenlicht kann ausgefiltert werden) und eine höhere Augensicherheit bieten (im Vergleich zu Wellenlängen im Nahinfrarotbereich sind 10-fach höhere Leistungsniveaus möglich).

Coherent verfügt über eine ausgereifte Plattform für die Produktion von VCSELs und EELs auf 6-Zoll-GaAs-Wafern. Das hat es uns ermöglicht, zum umsatzstärksten Anbieter in dieser Technologie aufzusteigen und kontinuierliche Geräte mit herausragender Zuverlässigkeit und Leistung bereitzustellen. 

Lichtquellen für 3D-Sensing werden in der Regel entweder als Flood-Strahler oder als Musterprojektoren konfiguriert. Flood-Strahler bieten eine homogene Lichtabdeckung in einem bestimmten Winkelbereich. Sie werden für Anwendungen wie Gesichts- und Gestenerkennung eingesetzt, bei denen eine gleichmäßige Lichtverteilung über das gesamte Blickfeld wichtig für korrekte Messungen ist. 

Musterprojektoren kommen gleichermaßen mit Triangulations- und ToF-Systemen zum Einsatz. Die Kombination von Lichtmustern mit ToF-Messungen steigert das Signal-Rausch-Verhältnis und reduziert Messfehler durch Multipfad-Verlaufswege. Dabei handelt es sich um Ungenauigkeiten, die entstehen, wenn der Lichtstrahl von mehr als einer Oberfläche reflektiert wird, bevor er den Sensor erreicht.  

In jedem Fall werden Optiken eingesetzt, um das Laserlicht zu formen und an die exakten Anforderungen der Anwendung anzupassen. Für die Herstellung eines Flood-Strahlers können für gewöhnlich relativ einfache, kostengünstige geformte Kunststofflinsen verwendet werden. Aber strukturierte Lichtquellen haben höhere Ansprüche. 

Coherent erfüllt den Bedarf nach einer strukturierten Beleuchtung mit diffraktiven optischen Elementen (DOEs) und Meta-Optiken. Letztere werden aus Nanostrukturen – physischen Bestandteilen, die kleiner sind als die Wellenlänge des Lichts – gefertigt, um ihre Ausbreitungseigenschaften zu verändern. Beispielsweise können die Form, der Divergenzwinkel und die Intensitätsverteilung des Lichtstrahls verändert oder der Strahl selbst zerteilt werden, um strukturierte Lichtmuster zu erzeugen. 

Ein großer Vorteil der Meta-Optiken von Coherent ist, dass mit ihnen mehrere optische Funktionen wie Strahlkollimation und -aufspaltung in einem einzigen kompakten Element kombiniert werden können. So lassen sich die Größe und Komplexität des optischen Systems reduzieren, was auch der Leistung des 3D-Sensing-Moduls zugutekommt. 

Ein weiteres Alleinstellungsmerkmal von Coherent ist unsere Fähigkeit, eine vollständige Beleuchtungsmodul-Lösung zu entwickeln und vertikal zu integrieren. Mit dieser Integration gewährleisten wir, dass die Lichtquelle, Optiken, der Treiber-IC und die Verpackung alle für ein nahtlos funktionierendes Gesamtpaket optimiert werden. So können wir unseren Kunden zuverlässige, hochleistungsfähige und dennoch kostengünstige Produkte anbieten, die für den Masseneinsatz in anspruchsvollsten Anwendungen bereit sind.

 

Coherent produziert Flood-Beleuchtungsmodule und Punktprojektionsmodule.

 

Beispielsweise werden unsere Beleuchtungsmodule für 3D-Sensing dafür konzipiert, elektrische Parasiten (unerwünschte Kapazität, Induktivität oder Widerstände) zu minimieren. Nur so können wir zuverlässig den Lichtimpuls im Nanosekundenbereich und die noch kleineren Anstiegs-/Abfallzeiten steuern, auf die hochpräzise ToF-Sensoren angewiesen sind. Außerdem betonen wir die Bedeutung der Augensicherheit und implementieren Funktionen, die die Geräteintegrität und Ausgangsleistung überwachen und sicherstellen, dass das Laserlicht jederzeit und unter allen Umständen innerhalb vordefinierter, sicherer Bereiche bleibt. Dies ist für Verbraucherprodukte eine unerlässliche Voraussetzung.

Am Ende des Tages bietet Coherent mehr an als nur überlegene Komponenten: Sie erhalten ein Team, das mit den technologischen Feinheiten des 3D-Sensing vertraut ist und Ihnen eine vollständige, integrierte Lösung mit höherer Geräteleistung und Gewährleistung der Anwendersicherheit bereitstellen kann. Wenn Sie sich für eine Partnerschaft mit uns entscheiden, können Sie sich auf unsere herausragenden Leistungen und unsere kontinuierliche Entwicklung von photonischen Innovationen verlassen. 

Lesen Sie weitere Informationen über Coherent-Produkte für 3D-Sensing.