Karakasidis Alexandros
  • +30 2310 891.341
  • a.karakasidis uom.edu.gr
  • Office: C2, 231

    Karakasidis Alexandros

    Laboratory Teaching Personnel
    Department of Applied Informatics


    Curriculum Vitae

    Teaching


    • BIG DATA MINING
      (ΠΛ0833)

    Type
    ELECTIVE

    Department Abbreviation
    AI

    Department
    DEPARTMENT OF APPLIED INFORMATICS

    Course Outlines

    Semester: 8th (Spring) | Course type: Elective AI-TM | Weekly hours: 3 | ECTS: 5

    Instructors:         Karakasidis Alexandros

    General competences

    The lesson focuses on learning the management of Big Data. After the successful completion of the course, the students will be able to:

    • Identify the sources and the characteristics of Big Data and how these characteristics affect Big Data management.

    • Use the existing Big Data management platforms.

    • Apply programming concepts, structures and techniques for Big Data management.

    • Design algorithms appropriate for Big data analysis

    • Use Python programming language for data analysis.

    • Use basic existing algorithms for Big Sata analysis

    • Identify the type of a Big Data analysis problem and select appropriate algorithms

    • Desing algorithms appropriate for execution on Big Data platforms

    • Implement programs using Big Data platforms

    • Select appropriate Big Data platforms for problem solving

     

    Course content

    1. Introduction to Big Data Analytics – Big Data Platforms.

    2. Introduction to Python for data analysis. Use of Jupyter Notebooks.

    3. Introduction to MapReduce. Algorithm design with MapReduce.

    4. Hadoop: Philosophy, architecture and tools, Hadoop cluster. HDFS distributed file system.

    5. Hadoop Map Reduce in Practice. Installation and programming with Hadoop Map Reduce.

    6. Data storage. Categories of NoSQL systems. The CAP theorem. Installation and use of HBase.

    7. Apache Spark. Philosophy, arhitecture, installation, programming & examples.

    8. Finding similar elements. Similarity measures. The LSH method.

    9. Big Data Algorithms - Clustering: Hierarchical, K-means. Apache Spark MLLib for clustering.

    10. Big Data Algorithms - Classification: Naive Bayes, decision trees. Apache Spark MLLib for classification.

    11. Big Data Algorithms Association Rules: Frequent itemsets, a-priori algorithm, FP-growth algorithm. Apache Spark MLLib for frequent itemsets.

    12. Stream Data Analysis: Sampling, counting distinct elements in a stream, Bloom filters. Apache Spark Streaming for data streams.

    13. Graph and Social Graph Analysis: Clustering, Triangle counting. Apache Spark GraphX for data analysis

    Assessment

    50% Projects (2x25%)

    50% Final exam

     

    Course bibliography

    (One of the following):

    94700707 Εξόρυξη από Μεγάλα Σύνολα Δεδομένων - 3η Έκδοση, Τύπος: Σύγγραμμα, Anand Rajaraman, Jeffrey David Ullman, Jure Leskovec, 2020, Εκδόσεις Νέων Τεχνολογιών, ISBN: 978-960-578-066-1

     

    77107675 Εισαγωγή στην εξόρυξη δεδομένων, 2η Έκδοση, Τύπος: Σύγγραμμα, Tan Pang - Ning,Steinbach Michael,Kumar Vipin, Βερύκιος Βασίλειος (επιμέλεια), 2018, ΤΖΙΟΛΑ, ISBN: 978-960-418-813-0

     

    31391 Εξόρυξη γνώσης από βάσεις δεδομένων και τον παγκόσμιο ιστό, Τύπος: Σύγγραμμα, Βαζιργιάννης Μιχάλης, Χαλκίδη Μαρία, 2005, Τυπωθήτω, ISBN: 978-960-402-116-8

     

    395 DATA MINING, Τύπος: Σύγγραμμα, Margaret H. Dunham, 2004, ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ, ISBN: 960-8105-72-2

     

    Additional material

    (http://compus.uom.gr/INF290/index.php)

    • DATA STRUCTURES
      (AIC205)

    Type
    COMPULSORY

    Department Abbreviation
    AI

    Department
    DEPARTMENT OF APPLIED INFORMATICS

    Course Outlines

    Semester: 2 (Spring) | Orientation: CS-IS | Compulsory | Weekly Hours: 3 | Credit Units (ECTS): 5

    Instructors: Satratzemi Maria, Koloniari Georgia, Karakasidis Alexandros

    General competences

    The goal of this course is the study of data structures and it is focused in two axes: a) the recognition and the development of useful mathematic models (Abstract Data Types (ADT)) and their functions as well as the determination of categories of problems that they can solve, and b) the development of methods of representation for the objects of abstract data models and the implementation of their functions in the procedural programming language C.

    Course Content

    1. Introduction to data structures, Abstract Data Type (ADT)
    2. Stacks, basic operations, implementing Stacks with arrays and records, application of Stacks.
    3. Queues, basic operations, implementing Queues with arrays and records, application of Queues.
    4. Lists, basic operations, sequential storage implementation of Lists.
    5. Introduction to Linked Lists, array-based implementation of Linked Lists. A pointer-based implementation of Linked Lists. A pointer-based implementation of Stacks and Queues. Application of Lists.
    6. Trees, Binary Trees, basic operations. A pointer-based implementation of Binary Trees. A recursive implementation of Binary Trees. Application of Binary Trees: Huffman Codes. Full Binary Trees, Minimum/Maximum Trees, Heap.
    7. Hashing, open probing, chaining, implementation of Hash table.
    8. B-Trees, basic operations.
    9. AVL Trees, basic operations.

    Assessment

    Written Examination 80%
    Compulsory Assignments 20%

    Bibliography

    (One of the following):
    77112308 Δομές Δεδομένων με C, Τύπος: Σύγγραμμα, Νικόλαος Μισυρλής, 2017, ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ, ISBN: 978-960-466-181-7

    18548971 Δομές δεδομένων, αλγόριθμοι και εφαρμογές C++, Τύπος: Σύγγραμμα, Sahnii Sartaj, 2004, ΤΖΙΟΛΑ, ISBN: 978-960-418-030-1

    59357253 Δομές Δεδομένων, 2η Έκδοση, Τύπος: Σύγγραμμα, Μποζάνης Παναγιώτης Δ., 2016, ΤΖΙΟΛΑ, ISBN: 978-960-418-594-8

    50658958 Δομές Δεδομένων και Αλγόριθμοι με Αντικειμενοστρεφή Σχεδιαστικά Μορφήματα στη C++, Τύπος: Σύγγραμμα, BrunoR. Preiss, Επιστ. Επιμ. Κώστας Κοντογιάννης, 2016, Πεδίο Α.Ε., ISBN: 978-960-546-692-3

    Supplementary material

    Course website (http://compus.uom.gr/INF159/)

    • PROCEDURAL PROGRAMMING
      (AIC103)

    Type
    COMPULSORY

    Department Abbreviation
    AI

    Department
    DEPARTMENT OF APPLIED INFORMATICS

    Course Outlines

    Εξάμηνο: 1ο (Χειμερινό) | Κατεύθυνση: ΕΤΥ-ΠΣ | Υποχρεωτικό Κορμού | Εβδ.διδασκαλία: 4 | Πιστωτικές Μονάδες (ECTS): 5

    Διδάσκοντες: Σατρατζέμη Μαρία, Χατζηγεωργίου Αλέξανδρος, Ξυνόγαλος Στέλιος, Σακελλαρίου Ηλίας, Κασκάλης Θεόδωρος, Αμπατζόγλου Απόστολος, Καρακασίδης Αλέξανδρος

    Μαθησιακά αποτελέσματα

    Μετά την επιτυχή ολοκλήρωση του μαθήματος, οι φοιτητές θα είναι ικανοί να:
    • να εφαρμόζουν τις βασικές αρχές ανάπτυξης λογισμικού σε μια διαδικαστική γλώσσα προγραμματισμού,
    • να συγγράφουν κώδικα σύμφωνα με το συντακτικό της γλώσσας C, κλασσικού αντιπρόσωπου της διαδικαστικής σχολής προγραμματισμού,
    • να κατανοούν την έννοια του τύπου δεδομένων και των συναφών λειτουργιών (operations), και να συνθέτουν πολύπλοκους νέους τύπους βασιζόμενοι σε πρωταρχικούς, στοχεύοντας στην ορθή αναπαράσταση των δεδομένων του προς επίλυση προβλήματος,
    • να αξιοποιούν σε προγράμματα την έννοια της συνάρτησης, του τύπου της, των παραμέτρων και της εμβέλειας των μεταβλητών και της κλήσης, και να μπορούν να ορίζουν ορθά νέες συναρτήσεις σε μια γλώσσα προγραμματισμού,
    • να σχεδιάζουν και να αναπτύσσουν μικρού μεγέθους προγράμματα, αξιολογώντας και επιλέγοντας κατάλληλες προγραμματιστικές δομές (εντολές ελέγχου ροής, εντολές επανάληψης) και τους αντίστοιχους βασικούς/σύνθετους τύπους δεδομένων,
    • να συνθέτουν λύσεις σε περισσότερο πολύπλοκα προβλήματα, χρησιμοποιώντας τις έννοιες της αφαίρεσης (abstraction) και αποδόμησης (decomposition) βασισμένη σε διαδικασίες.

    Με βάση την ταξινομία του Bloom τα ΜΑ καλύπτουν και τις 6 κατηγορίες: γνώση, κατανόηση, εφαρμογή, ανάλυση, σύνθεση και αξιολόγηση.

    Αυτόνομη εργασία
    Άσκηση κριτικής και αυτοκριτικής
    Αναζήτηση, ανάλυση και σύνθεση δεδομένων και πληροφοριών, με τη χρήση και των απαραίτητων τεχνολογιών
    Προσαρμογή σε νέες καταστάσεις
    Λήψη αποφάσεων
    Εργασία σε διεθνές περιβάλλον
    Προαγωγή της ελεύθερης, δημιουργικής και επαγωγικής σκέψης

    Περιεχόμενο μαθήματος

    Εισαγωγή στις γλώσσες προγραμματισμού. Περιβάλλοντα ανάπτυξης γλωσσών προγραμματισμού.
    Βασικές έννοιες της γλώσσας C: Η έννοια της μεταβλητής, τύποι μεταβλητών, απόδοση τιμής, τελεστές και παραστάσεις., βασικοί τύποι δεδομένων.
    Ροή Ελέγχου: Εντολές Διακλάδωσης υπό συνθήκη, Εντολές επανάληψης. Διαδικαστικός Προγραμματισμός: Συναρτήσεις.
    Δείκτες.
    Δομημένοι τύποι δεδομένων: Πίνακες, Αλφαριθμητικά, Εγγραφές/δομές & πίνακες Εγγραφών/δομών,
    Δείκτες και συναρτήσεις, Δείκτες και πίνακες. Δείκτες και αλφαριθμητικά. Αριθμητική διευθύνσεων. Δυναμική διαχείριση μνήμης
    Είσοδος και Έξοδος: Αρχεία κειμένου
    Χρήση του προγραμματιστικού περιβάλλοντος Code:Blocks, Ανάπτυξη, δοκιμή και αποσφαλμάτωση προγραμμάτων (εργαστηριακό μέρος μαθήματος).
    Ανάπτυξη προγραμμάτων μικρού και μεσαίου μεγέθους στο εργαστήριο και κατ’ οίκον εργασία.

    Αξιολόγηση φοιτητών

    1. Εξέταση γραπτή στο τέλος του εξαμήνου σε εργαστήριο,
    2. Κατ’ οίκον εβδομαδιαίες εργασίες ανάπτυξης κώδικα. Περίπου 3 προγράμματα /βδομάδα Χ 12 βδομάδες = ~36 προγράμματα μικρού και μεσαίου μεγέθους αναπτύσσει κάθε φοιτητής το εξάμηνο
    Τόσο η τελική εξέταση όσο και οι εβδομαδιαίες εργασίες στοχεύουν στην επίλυση προβλημάτων με την ανάπτυξη αλγόριθμων και υλοποίηση τους σε πρόγραμμα με τη γλώσσα προγραμματισμού C.
    Προσδιορισμένα κριτήρια
    Το (1) συμβάλλει στο 85%
    Το (2) συμβάλλει στο 15%
    Προσβάσιμα στους φοιτητές μέσω της ιστοσελίδας τους μαθήματος

    Βιβλιογραφία

    (Ένα από τα παρακάτω:)

    68384925 Η ΓΛΩΣΣΑ C ΣΕ ΒΑΘΟΣ, Τύπος: Σύγγραμμα, ΝΙΚΟΣ Μ. ΧΑΤΖΗΓΙΑΝΝΑΚΗΣ, 2017, ΕΚΔΟΣΕΙΣ ΚΛΕΙΔΑΡΙΘΜΟΣ ΕΠΕ, ISBN: 978-960-461-715-9

     

    13767 Η ΤΕΧΝΗ ΚΑΙ ΕΠΙΣΤΗΜΗ ΤΗΣ C: ΜΙΑ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ, Τύπος: Σύγγραμμα, ERIC S. ROBERTS, 2004, ΕΚΔΟΣΕΙΣ ΚΛΕΙΔΑΡΙΘΜΟΣ ΕΠΕ, ISBN: 960-209-791-4

     

    68370518 Εισαγωγή στη γλώσσα C, με παραδείγματα και ασκήσεις, Τύπος: Σύγγραμμα, Αλέξανδρος Καράκος, 2012, Καράκος Αλεξανδρος (Αυτοέκδοση), ISBN: 9789609340694

     

    68383623 C: Από τη Θεωρία στην Εφαρμογή, Τύπος: Σύγγραμμα, Γ. Σ. Τσελίκης - Ν. Δ. Τσελίκας, 2016, Γ.Σ.Τσελίκης - Ν.Δ.Τσελίκας, ISBN: 978-960-93-1961-4

    Συμπληρωματικό υλικό

    Ιστοσελίδα μαθήματος (http://compus.uom.gr/INF122/ )

    Publications


    • Books (2 records)

    Περιλαμβάνει Βιβλία ή/και μονογραφίες σε διεθνείς ή ελληνικούς εκδοτικούς οίκους. Κεφάλαια ή άρθρα συλλογικών τόμων ή επιμέλεια τόμων σε διεθνείς ή ελληνικούς εκδοτικούς οίκους.

      2019

      • A. Karakasidis, G. Koloniari: Private Entity Resolution for Big Data on Apache Spark Using Multiple Phonetic Codes. In Big Data Recommender Systems: Recent trends and advances (2019). IET. ISBN: 978-1-78561-975-5, 283-302

      2011

      • A. Karakasidis, V. S. Verykios: Privacy Preserving Record Linkage. In E-Activity and Intelligent Web Construction: Effects of Social Design Book Series (2011), IGI Global. ISBN:1615208712, 22-34.
      • Scientific Journals (3 records)

      Περιλαμβάνει Άρθρα σε διεθνή ή ελληνικά επιστημονικά περιοδικά (με κριτές).

        2018

        • Α. Karakasidis, G. Pallis, M. D. Dikaiakos, Two-Hop Privacy-Preserving Nearest Friend Searches, Knowledge and Information Systems, December 2018, DOI: 10.1007/s10115-018-1313-8, ISSN: 0219-3116.

        2011

        • Α. Karakasidis, V. S. Verykios, Secure Blocking + Secure Matching = Secure Record Linkage. Journal of Computing Science and Engineering, Vol. 5, Number 3, September 2011, 223-235.

        2009

        • V. S. Verykios., A. Karakasidis, and V Mitrogiannis. Privacy Preserving Record Linkage Approaches. International Journal of Data Mining, Modeling and Management, Vol. 1, Issue: 2, 2009, 206-221.
        • Conferences (12 records)

        Περιλαμβάνει Άρθρα σε δημοσιευμένα πρακτικά διεθνών ή ελληνικών συνεδρίων (με κριτές).

          2019

          • N. Sachpenderis, A. Karakasidis, G. Koloniari. Structure and Content based Community Detection in Evolving Social Networks. The 11th International ACM Conference on Management of Digital EcoSystems, 2019.
          • A. Karakasidis, E Pitoura. Identifying Bias in Name Matching Tasks. 22nd International Conference on Extending Database Technology, (2019), 626-629.

          2017

          • A. Karakasidis, G. Koloniari. Phonetics-based Parallel Privacy Preserving Record Lin- kage. The 12th International Conference on P2P, Parallel, Grid, Cloud and Internet Com- puting, (2017), 179-190.

          2015

          • A. Karakasidis, G. Koloniari and V.S. Verykios. Privacy Preserving Blocking and Meta-Blocking. Proceedings, Part III, of the European Conference ECML PKDD 2015 on Machine Learning and Knowledge Discovery in Databases, (2015), 232-236.
          • A. Karakasidis, G. Koloniari and V.S. Verykios. Scalable Blocking for Privacy Preserving Record Linkage. Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, (2015), 527-536.
          • A. Karakasidis, G. Koloniari and V.S. Verykios. PRIVATEER: A Private Record Linkage Toolkit. Proceedings of the CAiSE 2015 Forum at the 27th International Conference on Advanced Information Systems Engineering, co-located with CAiSE 2015, (2015), 197-204.

          2013

          • A. Karakasidis, V. S. Verykios: A Simulator for Privacy Preserving Record Linkage. Proceedings of the 2nd Mining Humanistic Data Workshop, co-located with Engineering Applications of Neural Networks: 14th International Conference, EANN 2013, Halkidiki, Greece, September 13-16, 2013 (2013), Part II, 164-173.

          2012

          • A. Karakasidis, V. S. Verykios: A Sorted Neighborhood Approach to Multidimensional Privacy-Preserving Blocking. Proceedings of the 2012 IEEE 12th International Conference on Data Mining 2012 PhD Forum, (2012), 937-944.
          • A. Karakasidis, V. S. Verykios: A Highly Efficient and Secure Multidimensional Blocking Approach For Privacy Preserving Record Linkage. Proceedings of the 2012 IEEE 24th International Conference on Tools with Artificial Intelligence (2012), vol. 01, 428-435.

          2009

          • A. Karakasidis, V. S. Verykios: Privacy Preserving Record Linkage Using Phonetic Codes. Proceedings of the 4th Balkan Conference in Informatics, (2009), 101-106.

          2005

          • A. Karakasidis, P. Vassiliadis, E. Pitoura: ETL Queues for Active Data Warehousing. Proceedings of the 2nd International Workshop on Information Quality in Information Systems (IQIS), co-located with SIGMOD 2005, (2005), 28-39.

          2002

          • A. Karakasidis, E. Pitoura: DBGlobe: A Data-Centric Approach to Global Computing. Proceedings of the 2nd International Workshop on Smart Appliances and Wearable Computing (IWSAWC), co-located with the 22nd International Conference on Distributed Computing Systems, (2002), 735-740.
          • Other (3 records)

          Περιλαμβάνει Παρουσιάσεις σε διεθνή ή ελληνικά συνέδρια χωρίς δημοσίευση σε πρακτικά.

            2019

            • A. Karakasidis, E Pitoura. Identifying Bias in Name Matching Tasks. Hellenic Data Management Symposium (2019).

            2018

            • Α. Karakasidis, G. Pallis, M. D. Dikaiakos, Two-Hop Privacy-Preserving Nearest Friend Searches, Hellenic Data Management Symposium (2019).

            2016

            • A. Karakasidis, G. Koloniari, V.S. Verykios: Scalable Blocking for Privacy Preserving Record Linkage. Hellenic Data Management Symposium (2016).