Auf Partys oder in größeren Menschenmengen fällt es uns als Menschen in der Regel nicht allzu schwer, einzelnen Personen in unserem Kopf die richtige Stimme zuzuordnen, sodass wir den richtigen Personen antworten können. In der Psychologie nennt sich dieses Phänomen auch „Cocktailparty-Effekt“. Computer haben damit schon ein größeres Problem.

KI in Party-Stimmung

Umso erstaunlicher ist es, was die Entwickler der Google KI nun erreicht haben. Engadget berichtet, dass diese virtuelle „Partys“ erschaffen hätten, um der künstlichen Intelligenz beizubringen, Geräusche voneinander zu unterscheiden und somit einzelne Stimmen zu separieren. Hierfür zerlegt die KI die Geräuschkulisse in einzelne Audio-Stränge und isoliert die relevanten Stimmen von den Hintergrundgeräuschen.

Mit der Hilfe von Kameras analysiert das System außerdem Gesichter, sodass es im Anschluss der korrekten Person deren Stimme zugewiesen werden kann, um ihr „zuzuhören“. Somit kann die KI eine klare Tonaufnahme von dem machen, was ein Mensch sagt, indem sie sich schlichtweg auf dessen Gesicht fokussiert – das funktioniert sogar, wenn der Mund durch ein Mikrofon oder ähnliches zeitweilig verdeckt wird.

Potentielle Anwendungen

Google arbeitet stetig weiter an seiner KI und versucht herauszufinden, inwiefern sich die neue Entwicklung in bestehende Systeme integrieren lässt. So will man die Technologie beispielsweise als Hör-Unterstützung nutzen, um Menschen, die vor einem stehen, mit Hilfe der Smartphone-Kameras besser zu verstehen.

———-

Das könnte ebenfalls interessant sein:

———-

Google ist nicht allein

Auch andere Hersteller arbeiten an der künstlichen Intelligenz. Mit Headsets wollen einige von ihnen beispielsweise Gedanken in Schrift umwandeln, sodass der Nutzer nicht einmal mehr die Finger auf eine Tastatur legen muss. Andere wiederum wollen mit ihrer Hilfe Autounfälle vermeiden oder Alzheimer behandeln. Die Anwendungsgebiete der künstlichen Intelligenz haben bisher keine Grenzen.

Neueste Videos auf futurezone.de