Capsule Networks (CapsNets)

Capsule Networks (CapsNets)

Capsule Networks (CapsNets) sind eine Weiterentwicklung klassischer Convolutional Neural Networks (CNN), die entwickelt wurden, um deren Schwächen bei der Erkennung komplexer Strukturen zu überwinden. Während CNNs oft Schwierigkeiten haben, räumliche Beziehungen zwischen Objekten konsistent zu erfassen, modellieren CapsNets diese Beziehungen explizit durch sogenannte Kapseln. Eine Kapsel ist eine kleine Gruppe von Neuronen, die gemeinsam nicht nur das Vorhandensein eines Merkmals erkennen, sondern auch dessen Eigenschaften wie Position, Orientierung oder Skalierung.

Wie funktionieren Capsule Networks?

Capsule Networks bestehen aus mehreren Schichten von Kapseln, die ihre Informationen über Dynamic Routing weitergeben:

  • Kapseln: Erkennen Merkmale in den Eingangsdaten und speichern zusätzliche Informationen über deren Parameter.
  • Dynamic Routing: Bestimmt, welche Kapseln Informationen an welche nachgelagerten Kapseln weiterleiten. Dies ermöglicht es, Hierarchien von Objekten besser zu modellieren.
  • Vektor-Repräsentation: Statt einzelner Aktivierungen arbeiten Kapseln mit Vektoren oder Matrizen, die reichhaltigere Informationen transportieren.

Praxisbeispiele:

  • Bildklassifikation: Robuste Erkennung von Objekten, auch wenn diese teilweise verdeckt oder verdreht sind.
  • Medizinische Bildanalyse: Erkennung von Tumoren oder Anomalien in Röntgenbildern und MRTs.
  • Autonomes Fahren: Bessere Identifizierung von Verkehrsschildern und Objekten in komplexen Umgebungen.
  • Industrie: Qualitätskontrolle bei variierenden Perspektiven von Produkten.

Vorteile:

  • Hierarchische Erkennung: Erfasst nicht nur Objekte, sondern auch deren räumliche Beziehungen.
  • Robustheit: Unempfindlicher gegenüber Transformationen wie Rotation oder Skalierung.
  • Effizienz: Kann mit weniger Trainingsdaten bessere Ergebnisse erzielen.

Herausforderungen:

  • Rechenaufwand: Dynamic Routing ist komplexer und langsamer als Standard-CNNs.
  • Forschung: Noch nicht so weit verbreitet in Praxis und Frameworks.
  • Konkurrenz durch Transformer: Moderne Vision Transformer erreichen oft vergleichbare oder bessere Ergebnisse.

Verwandte Begriffe:

Convolutional Neural Networks (CNN), Deep Learning, Vision Transformer (ViT), Computer Vision, Bildklassifikation, Dynamic Routing, Feature Extraction, Künstliche Intelligenz, Autonomes Fahren, Medizinische Bildanalyse

Autor: IKTconcept Redaktion • Letzte Aktualisierung: 15. September 2025
Quelle: IKTconcept IT-Glossar, IKTconcept Startseite