Computer Vision

Στόχοι

Εισαγωγή στην θεωρία των θεμελιωδών προβλημάτων της υπολογιστικής όρασης (computer vision), μαθηματικά μοντέλα και υπολογιστικοί αλγόριθμοι για την επίλυση τους, σύνοψη ενδείξεων από βιολογική και γνωστική όραση, και περιγραφή επιλεγμένων εφαρμογών.

Προσωπικό

Petros Maragos Διδάσκων

Petros Koutras
Βοηθός

Περιεχόμενα

  • Σχηματισμός & φυσική εικόνων: Στοιχεία από Προοπτική Γεωμετρία, Ακτινομετρία-Φωτομετρία, Αισθητήρες, Σκίαση και 3Δ Ανακατασκευή, Χρώμα.
  • Ανάλυση 2Δ/3Δ εικόνων.
    • Σύντομη ανασκόπηση Γραμμικών Φίλτρων & Fourier Ανάλυσης με έμφαση σε φίλτρα Gabor και Wavelets.
    • Μη-γραμμικά Φίλτρα και Τελεστές (μορφολογικά, τάξης, πλέγματος) για σχήματα και εικόνες: Αλγεβρική και Γεωμετρική ανάλυση.
  • Aνάλυση εικόνων σε Πολλαπλές Κλίμακες και Πυραμίδες (Gaussian & Νonlinear Scale-spaces).
  • Ανίχνευση Aκμών, γωνιών και άλλων γεωμετρικών χαρακτηριστικών (Feature detection).
  • Ανάλυση Σχήματος: Καμπυλότητα, Μετασχηματισμοί απόστασης & σκελετού, Ιστογράμματα μεγέθους.
  • Ανάλυση/μοντελοποίηση Υφής-texture: Textons, Gabor filterbanks, Fractals, Markov Τυχαία Πεδία.
  • Κατάτμηση Εικόνων (Segmentation): Γεωμετρικές, Στατιστικές και Γραφικές Μέθοδοι.
  • Ανίχνευση και Εκτίμηση 2Δ Οπτικής Ροής και 3Δ Κίνησης Οπτικών Αντικειμένων.
  • Στερέοψη. Εκτίμηση 3Δ δομής-σχήματος.
  • Ενεργές Καμπύλες (active contours). Εξέλιξη καμπυλών/επιφανειών με Μεθόδους Επιπεδοσυνόλων (Level Sets).
  • Ανίχνευση και Αναγνώριση οπτικών αντικειμένων.
  • Σύντομη περιγραφή επιλεγμένων εφαρμογών, διάχυτη στα ανωτέρω θέματα.

Βαθμολογία

ΕξέτασηΑσκήσεις*
65%35% (Αναλυτικές: 15%, Υπολογιστικές: 20%, 3 ομάδες ασκήσεων**)
(*)   Προϋπόθεση για να μετρήσουν οι ασκήσεις στην βαθμολογία: βαθμός εξέτασης ≥ 3.5..
(**)   Οι αναλυτικές ασκήσεις είναι ατομική εργασία, ενώ οι υπολογιστικές ασκήσεις γίνονται με MatLab από ομάδες δύο φοιτητών..

Βιβλίο

Πέτρος Μαραγκός,
Σημειώσεις Ορασης Υπολογιστών,
Ε.Μ.Π. 2005 και 2015

Συμπληρωματικές Σημειώσεις

Διαφάνειες  

Κεφάλαια/Διαφάνειες από βιβλίο ”Ανάλυση Εικόνων και Όραση Υπολογιστών”, Π. Μαραγκός

Copyright © Πέτρος Μαραγκός.
Οι σημειώσεις αυτές αποτελούν κεφάλαια του βιβλίου ΟΡΑΣΗ ΥΠΟΛΟΓΙΣΤΩΝ που θα δημοσιευθεί. Μπορούν να χρησιμοποιηθούν ως βοήθημα από τους φοιτητές που έχουν εγγραφεί στο μάθημα Όραση Υπολογιστών του Ε.Μ.Π. και μόνο για τους σκοπούς του μαθήματος. Απαγορεύεται η ολική ή μερική αναπαραγωγή τους ή η ανάρτησή τους σε άλλη ιστοσελίδα ή η χρησιμοποίηση τους για οποιοδήποτε άλλο σκοπό χωρίς την έγκριση του διδάσκοντος.
ΚεφάλαιοΤίτλοςΚείμενο 2005-2014Νέο Κείμενο 2015Διαφάνειες
Τίτλος και Πίνακας Περιεχομένων  
Κεφάλαιο 1ΕισαγωγήΔιαφάνειες  
Κεφάλαιο 2Σχηματισμός Εικόνων: Προβολή, Φωτισμός, ΑισθητήρεςΚείμενο  Διαφάνειες  
Κεφάλαιο 3Οπτικά Συστήματα
Κεφάλαιο 4Ακτινομετρία και Ανακατασκευή 3Δ σχήματοςΚείμενοΔιαφάνειες  
Κεφάλαιο 5ΧρώμαΚείμενο  Διαφάνειες  
Κεφάλαιο 6Γραμμικοί Τελεστές ΕικόνωνΚείμενο  Διαφάνειες  
Κεφάλαιο 7Δυαδικές Εικόνες και Τελεστές ΣυνόλωνΚείμενο  Διαφάνειες  
Κεφάλαιο 8Μορφολογικοί Τελεστές Γκρίζων Εικόνων: Γεωμετρικά ΦίλτραΚείμενο  Διαφάνειες   
Κεφάλαιο 9Τελεστές Πλέγματος για Εικόνες και Σχήματα: Αλγεβρικά ΦίλτραΚείμενο  Διαφάνειες   
Κεφάλαιο 10Ανίχνευση ΧαρακτηριστικώνΚείμενο  newΔιαφάνειες  
Κεφάλαιο 11Ανάλυση Εικόνων σε Πολλαπλές Κλίμακες (Scale-Spaces)ΚείμενοΔιαφάνειες   
Κεφάλαιο 12ΣχήμαΚείμενο  Διαφάνειες  
Κεφάλαιο 13ΥφήΚείμενοΔιαφάνειες   
Κεφάλαιο 14Fractals
Κεφάλαιο 15ΚίνησηΚείμενοΔιαφάνειες  
Κεφάλαιο 16Στερέοψη και Γεωμετρία Πολλαπλών ΕικόνωνΚείμενοΔιαφάνειες  
Κεφάλαιο 17Ενεργά Περιγράμματα, Επιπεδοσύνολα και Μεταβολικές ΜέθοδοιΚείμενοΔιαφάνειες  
Κεφάλαιο 18ΚατάτμησηΚείμενοΔιαφάνειες   
Κεφάλαιο 19Αναγνώριση ΑντικειμένωνΚείμενο  newΔιαφάνειες  
Κεφάλαιο 20Video Understanding: Action and Gesture RecognitionΚείμενο
AppendixΜαθηματικά Στοιχεία Συνόλων και Σημάτων ΕικόνωνΚείμενο
Βιβλιογραφία

Βιβλιογραφία

  1. R. Haralick and L. Sapiro, Computer and Robot Vision, Volumes I & II, Addison-Wesley, 1992-93
  2. O. Faugeras, Three-Dimensional Computer Vision, MIT Press, 1993.
  3. D. Forsyth and J. Ponce, Computer Vision: A Modern Approach, 2003
  4. R. Szeliski, Computer Vision: Algorithms and Applications, Springer 2010. Available from here.
  5. O. Faugeras and Q.T. Luong, Geometry of Multiple Images, MIT Press, 2001
  6. R. Hartley and A. Zisserman, Multiple View Geometry, Cambridge Univ. Press, 2000, 2004. Available from here.
  7. D. Marr, Vision, W. Freeman & Co., New York, 1982
  8. B. Horn, Robot Vision, MIT Press, Cambridge, Massachusetts, 1986
  9. D. Hubel, Eye, Brain, and Vision, Scientific American Library, 1988. Available from here.
  10. K. Castleman, Digital Image Processing, Pentice-Hall, 1996
2018-06-18T13:24:20+00:00