IVML  
  about | r&d | publications | courses | people | links
   

G. Tolias
Ανίχνευση Αντικειμένων σε Εικόνες και Ταξινόμηση Σκηνών με Χρήση Περιγραφέων MPEG-7 και Τεχνικών Οπτικού Θησαυρού
School of Electrical and Computer Engineering, National Technical University of Athens
ABSTRACT
Ο διαρκώς αυξανόμενος όγκος οπτικοακουστικού πολυμεσικού υλικού περιεχομένου τα τελευταία χρόνια έχει οδηγήσει στην ανάγκη αυτόματης εξαγωγής χαρακτηριστικών και αυτόματης περιγραφής του. Με χρήση διαφόρων περιγραφέων, καθώς και εκείνων που ορίζονται από το πρότυπο MPEG-7, γίνεται η προσπάθεια περιγραφής της χαμηλού επιπέδου πληροφορίας του. Στα πλαίσια της παρούσας διπλωματικής παρουσιάζονται περιγραφείς οπτικής πληροφορίας, αναπτύσεται μία εφαρμογή εξαγωγής από πολλαπλές περιοχές που ορίζονται από χάρτη περιοχών και διερευνάται η συμβατή με το eXperimentation Model λειτουργία της. Έπειτα γίνεται μία προσέγγιση του προβλήματος που αποκαλείται σημασιολογικό κενό, της αντιστοίχησης δηλαδή χαρακτηριστικών χαμηλού επιπέδου σε έννοιες υψηλού επιπέδου. Χρησιμοποιείται μία τεχνική βασισμένη σε περιοχές εικόνας και δημιουργείται ένας οπτικός θησαυρός για την αναπαράσταση της γνώσης. Εκπαιδεύονται νευρωνικά δίκτυα για τον εντοπισμό των εννοιών υψηλού επιπέδου. Θεωρώντας κάθε εικόνα σαν έγγραφο κειμένου και κάθε περιοχή σαν μία λέξη χρησιμοποιείται η τεχνική Λανθάνουσας Σημασιολογικής Ανάλυσης. Αποτελέσματα παρουσιάζονται για όλες τις παραπάνω τεχνικές, για διαφορετικά μεγέθη θησαυρού με σκοπό την επίτευξη των καλύτερων δυνατών αποτελσμάτων, καθώς και για πειράματα ταξινόμσησης εικόνων.
28 November , 2007
G. Tolias, "Ανίχνευση Αντικειμένων σε Εικόνες και Ταξινόμηση Σκηνών με Χρήση Περιγραφέων MPEG-7 και Τεχνικών Οπτικού Θησαυρού", School of Electrical and Computer Engineering, National Technical University of Athens
[ save PDF] [ BibTex] [ Print] [ Back]

© 00 The Image, Video and Multimedia Systems Laboratory - v1.12