ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ
ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

ΣΕΜΙΝΑΡΙΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
ΠΡΟΓΡΑΜΜΑ ΟΜΙΛΙΩΝ
Εαρινό Εξάμηνο 2011

Στο εβδομαδιαίο σεμινάριο Πληροφοριακών Συστημάτων του Τμήματος Πληροφορικής και Τηλεπικοινωνιών του Πανεπ. Αθηνών συζητιώνται πρόσφατα ερευνητικά αποτελέσματα και άλλη δραστηριότητα στον γενικότερο γνωστικό χώρο των βάσεων δεδομένων και γνώσεων, της εξόρυξης δεδομένων, των πολυμέσων, της διαχείρισης διαδικασιών και ροών εργασίας, και άλλων σχετικών θέματων. Όλοι όσοι έχουν συναφή ενδιαφέροντα (αλλά και όσοι δεν έχουν) είναι ευπρόσδεκτοι!

Όλες οι ομιλίες δίνονται στην Αίθουσα Συνεδριάσεων, Α56, Παρασκευή, 3:30μμ (καφές στις 3:00μμ). Πιθανές εξαιρέσεις θα ανακοινώνονται ανά περίπτωση.

Για περισσότερες πληροφορίες απευθυνθείτε στον Καθηγητή Γιάννη Ιωαννίδη (yannis παπάκι di τελεία uoa τελεία gr).
Παρακάτω ακολουθεί το πρόγραμμα του Εαρινού Εξαμήνου 2011. Σαν σημείο αναφοράς, υπάρχουν επίσης και τα προγράμματα παλαιοτέρων εξαμήνων.

ΣΕΜΙΝΑΡΙΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
ΠΡΟΓΡΑΜΜΑ ΟΜΙΛΙΩΝ
Εαρινό Εξάμηνο 2011

ΟΝΟΜΑ ΗΜΕΡΟΜΗΝΙΑ / ΑΙΘΟΥΣΑ ΤΙΤΛΟΣ ΟΜΙΛΙΑΣ
Δημήτρης Πιερράκος (ΕΚΠΑ και ΕΚΕΦΕ "Δημόκριτος") 21 Φεβρουαρίου (Δευτέρα, 10:00πμ) / Αίθουσα Α56 "Εξόρυξη Γνώσης από Δεδομένα Χρήσης του Παγκόσμιου Ιστού για την Εξατομίκευση Θεματικών Καταλόγων "
Εβίτα Μαΐλη (ΕΚΠΑ) 25 Φεβρουαρίου (Παρασκευή, 3:00μμ) / Αίθουσα Α56 "Δημιουργία ιστοσελίδων με το Σύστημα Drupal"
MaDgIK ΔΕΠ (ΕΚΠΑ) 18 Μαρτίου (Παρασκευή, 4:00μμ) / Αίθουσα Α56 "Γνωρίστε τους Καθηγητές του MaDgIK"
Δημήτριος Τσουμάκος (ΕΜΠ) 1 Απριλίου (Παρασκευή, 4:00μμ) / Αίθουσα Α56 "On the Elasticity of NoSQL Databases over Cloud Management Platforms"
Κώστας Τσακαλώζος (ΕΚΠΑ) 8 Απριλίου (Παρασκευή, 4:00μμ) / Αίθουσα Α56 "Flexible Use of Cloud Resources through Profit Maximization and Price Discrimination"
Alan Dix (U. Lancaster και Talis) 8 Απριλίου (Παρασκευή, 4:30μμ) / Αίθουσα Α56 "Web of Data, Web of People, Web of Action"
Χαράλαμπος Νικολάου (ΕΚΠΑ) 15 Απριλίου (Παρασκευή, 4:00μμ) / Αίθουσα Α56 "Αναζήτηση με Λέξεις-Κλειδιά σε Βάσεις Δεδομένων RDF"
Εμμανουήλ Καρπαθιωτάκης (ΕΚΠΑ) 15 Απριλίου (Παρασκευή, 4:30μμ) / Αίθουσα Α56 "Σχεδίαση και Υλοποίηση ενός Μητρώου για το Σημασιολογικό Πλέγμα Αισθητήρων"
Olivier Ballet (DXT) 20 Μαΐου (Παρασκευή, 4:00μμ) / Αίθουσα Α56 "Inscape: An Authoring and Experiencing Environment for Virtual Storytelling"
Κώστας Σαΐδης (ΕΚΠΑ) 23 Μαΐου (Δευτέρα, 10:00πμ) / Αίθουσα Α56 "Ιδεατοί Χώροι Πληροφορίας: Επέκταση και Ενοποίηση Ετερογενών Συλλογών Δεδομένων και Συναφών Συστημάτων"
Χεράλντ Κλλάπι (ΕΚΠΑ) 27 Μαΐου (Παρασκευή, 4:00μμ) / Αίθουσα Α56 "Schedule Optimization for Data Processing Flows on the Cloud"
Μανώλης Γιαννισάκης - Πάνος Παπαδάτος (ΕΚΠΑ) 27 Μαΐου (Παρασκευή, 4:30μμ) / Αίθουσα Α56 "Το Διαδικτυακό Eκπαιδευτικό Παιχνίδι Επαυξημένης Πραγματικότητας ARcropolis"
Παναγιώτης Λιάκος (ΕΚΠΑ) 3 Ιουνίου (Παρασκευή, 3:00μμ) / Αίθουσα Α56 "Θεματικά Εστιασμένη Προσκομιδή Ιστοσελίδων από τον Κρυμμένο Παγκόσμιο Ιστό"
Huseyin Akcan (Izmir University of Economics) 27 Ιουνίου (Δευτέρα, 4:00μμ) / Αίθουσα Α56 "GPS-Free Localization in Wireless Networks"
Κατερίνα Παπαντωνίου (ΕΚΠΑ) 1 Ιουλίου (Παρασκευή, 3:00μμ) / Αίθουσα Α56 "Εφαρμογές και Τεχνολογίες του Σημασιολογικού Ιστού στα Συστήματα Ερωταποκρίσεων"
Δημήτρης Μπηλίδας (ΕΚΠΑ) 1 Ιουλίου (Παρασκευή, 3:30μμ) / Αίθουσα Α56 "Σημασιολογία της Γλώσσας Ενημερώσεων RUL"
Ίρις Μηλιαράκη (ΕΚΠΑ) 21 Ιουλίου (Πέμπτη, 2:00μμ) / Αίθουσα Α56 "Κατανεμημένη Διήθηση Και Διάχυση XML Δεδομένων σε Συστήματα Ομοτίμων Κόμβων"
Ζωή Καούδη (ΕΚΠΑ) 21 Ιουλίου (Πέμπτη, 4:00μμ) / Αίθουσα Α56 "Κατανεμημένη Αποτίμηση Επερωτήσεων και Συλλογιστική για το Μοντέλο RDF σε Δίκτυα Ομότιμων Κόμβων"

ΠΕΡΙΛΗΨΕΙΣ ΟΜΙΛΙΩΝ


21 Φεβρουαρίου (Δευτέρα, 10:00πμ) / Αίθουσα Α56
Δημήτρης Πιερράκος (ΕΚΠΑ και ΕΚΕΦΕ "Δημόκριτος")
"Εξόρυξη Γνώσης από Δεδομένα Χρήσης του Παγκόσμιου Ιστού για την Εξατομίκευση Θεματικών Καταλόγων "

Η κύρια συνεισφορά της διατριβής αφορά την παρουσίαση μιας πρωτοποριακής προσέγγισης η οποία ξεπερνάει τα μειονεκτήματα της εξατομίκευσης του Παγκόσμιου Ιστού και των θεματικών καταλόγων του Παγκόσμιου Ιστού, συνδυάζει τα πλεονεκτήματά τους και παρέχει ένα καινούριο "εργαλείο" για την αντιμετώπιση της υπερ-πληροφόρησης. Ειδικότερα, η διατριβή εστιάζεται στην κατασκευή λειτουργικών θεματικών καταλόγων οι οποίοι μοντελοποιούν τα ενδιαφέροντα ομάδων χρηστών, που ονομάζονται κοινότητες χρηστών (user communities). Η δημιουργία κοινοτήτων χρηστών, δηλ., προτύπων χρήσης που αντιπροσωπεύουν τις προτιμήσεις πλοήγησης των μελών της κοινότητας, με τη βοήθεια της εξόρυξης γνώσης από δεδομένα χρήσης του Παγκόσμιου Ιστού, έχει αρχικά μελετηθεί στο πλαίσιο συγκεκριμένων ιστοτόπων. Στη εν λόγω διατριβή, επεκτείνουμε την προσέγγιση αυτή σε ένα πολύ μεγαλύτερο τμήμα του Παγκόσμιου Ιστού, μέσα από την ανάλυση των δεδομένων χρήσης που συλλέγονται από τους διακομιστές διαμεσολάβησης (proxy servers) ενός Παροχέα Υπηρεσιών Διαδικτύου (Internet Service Provider, ISP).

Κατά τη διάρκεια της διατριβής, αναπτύχθηκαν και αξιολογήθηκαν τρεις μέθοδοι μοντελοποίησης κοινοτήτων, με βάση την ομαδοποίηση (clustering) και την πιθανοτική μάθηση (probabilistic learning). Οι τεχνικές αυτές επιτρέπουν την αξιοποίηση των υπαρχόντων καταλόγων Παγκόσμιου Ιστού και την εξειδίκευσή τους ως προς τα ενδιαφέροντα των κοινοτήτων χρηστών. Σημαντική προϋπόθεση για την ανάπτυξη των τεχνικών αυτών είναι ότι πρέπει να επιτρέπουν την αλληλοεπικάλυψη των κοινοτήτων. Με άλλα λόγια, ο χρήστης πρέπει να μπορεί να είναι μέλος περισσοτέρων της μίας κοινότητας. Αυτό είναι πολύ σημαντικό για την εξατομίκευση του Παγκόσμιου Ιστού, καθώς ο χρήστης μπορεί να ανήκει σε περισσότερες από μία ομάδες.

Πιο συγκεκριμένα, στη διατριβή παρουσιάζεται ένα ολοκληρωμένο πλαίσιο ανακάλυψης γνώσης με στόχο τη δημιουργία εξατομικευμένων θεματικών καταλόγων Παγκόσμιου Ιστού, βασιζόμενοι σε κοινότητες χρηστών. Οι εξατομικευμένοι κατάλογοι αποτελούν ένα πρωτότυπο αντικείμενο εφαρμογής της εξατομίκευσης του Παγκόσμιου Ιστού, πέραν της Σύστασης Σελίδων (Web page Recommendations) ή τους προσαρμοσμένους ιστοτόπους (adaptive Web sites). Τα μέλη μιας κοινότητας μπορούν να χρησιμοποιούν τον εξατομικευμένο κατάλογο ως σημείο εκκίνησης για την πλοήγησή τους στον Παγκόσμιο Ιστό, βασιζόμενοι μόνο στη θεματολογία που τους ενδιαφέρει, χωρίς την υποχρέωση να προσπελαύνουν "αχανείς" θεματικούς καταλόγους. Επομένως, η εξατομίκευση μπορεί να αποδειχτεί ιδιαίτερα χρήσιμη για ένα μεγάλο και γενικό θεματικό κατάλογο όπως το ODP ή το Yahoo!. Οι εξατομικευμένες εκδόσεις των συγκεκριμένων καταλόγων μπορούν επίσης να χρησιμοποιηθούν από διάφορες υπηρεσίες του Παγκόσμιου Ιστού, π.χ., οι Πύλες Παγκόσμιου Ιστού (Web Portals), προκειμένου να παρέχουν στους συνδρομητές τους μια πιο εξατομικευμένη άποψή του. Επιπλέον, τους εξατομικευμένους καταλόγους μπορούν να εκμεταλλευθούν οι μηχανές αναζήτησης (Web search engines), προκειμένου να παρέχουν εξατομικευμένα αποτελέσματα σε ερωτήματα των χρηστών.

Επίσης, στη διατριβή παρουσιάζεται το σύστημα OurDMOZ, το οποίο ενσωματώνει και υλοποιεί τα διαφορετικά τμήματα της προτεινόμενης μεθοδολογίας. Συγκεκριμένα, το OurDMOZ συλλέγει και επεξεργάζεται δεδομένα χρήσης, αντιστοιχίζει τα δεδομένα στο θεματικό κατάλογο, εφαρμόζει τεχνικές μηχανικής μάθησης για την εξαγωγή των μοντέλων των κοινοτήτων χρηστών και στο τέλος κατασκευάζει τους εξατομικευμένους θεματικούς καταλόγους με βάση τις κοινότητες των χρηστών.

Η διατριβή περιλαμβάνει επιπλέον και τα αποτελέσματα της αξιολόγησης του συστήματος από χρήστες, η οποία πραγματοποιήθηκε προκειμένου να καταδειχθούν τα δυνητικά πλεονεκτήματα του συστήματος και κατ΄ επέκταση της έννοιας των εξατομικευμένων καταλόγων Παγκόσμιου Ιστού με βάση τις κοινότητες χρηστών για τον τελικό χρήστη.


25 Φεβρουαρίου (Παρασκευή, 3:00μμ) / Αίθουσα Α56
Εβίτα Μαΐλη (ΕΚΠΑ)
"Δημιουργία ιστοσελίδων με το Σύστημα Drupal"

Κατά κύριο λόγο, η ομιλία συτή θα παρουσιάσει την ανανεωμένη ιστοσελίδα της ομάδας Madgik. Θα δείξει πώς τα μέλη της ομάδας θα μπορούν να βάζουν την πληροφορία που τα αφορά, τί θα είναι στον έλεγχο των διαχειριστών, και τις άλλες λειτουργίες που θα παρέχονται. Μέσα από την περιγραφή της σελίδας του Μadgik αλλά και με άλλα παραδείγματα, η ομιλία θα αποτελέσει ουσιαστικά και μια καλή παρουσίαση της πλατφόρμας διαχείρισης δεδομένων Drupal.


18 Μαρτίου (Παρασκευή, 4:00μμ) / Αίθουσα Α56
MaDgIK ΔΕΠ (ΕΚΠΑ)
"Γνωρίστε τους Καθηγητές του MaDgIK"

Mέλη ΔΕΠ από την ομάδα MaDgIK (Γουνόπουλος, Δελής, Ιωαννίδης, Κουμπαράκης, Χατζόπουλος) παρουσιάζουν εμπεριστατωμένα τα θέματα με τα οποία ασχολούνται και στα οποία εποπτεύουν διπλωματικές και πτυχιακές εργασίες καθώς και διδακτορικές διατριβές.


1 Απριλίου (Παρασκευή, 4:00μμ) / Αίθουσα Α56
Δημήτριος Τσουμάκος (ΕΜΠ)
"On the Elasticity of NoSQL Databases over Cloud Management Platforms"

NoSQL databases focus on analytical processing of large scale datasets, offering increased scalability over commodity hardware. One of their strongest features is elasticity, which allows for fairly portioned premiums and high-quality performance. Yet, the process of adaptive expansion and contraction of resources usually involves a lot of manual effort during cluster configuration. To date, there exists no comparative study to quantify this cost and measure the efficacy of NoSQL engines that offer this feature. In this work, we perform a thorough study of the elasticity feature on some popular NoSQL databases over an open-source cloud computing platform. We also present a prototype implementation of a decision making system that enables automatic elastic operations of any NoSQL engine based on administrator or application-specified constraints.


8 Απριλίου (Παρασκευή, 4:00μμ) / Αίθουσα Α56
Κώστας Τσακαλώζος (ΕΚΠΑ)
"Flexible Use of Cloud Resources through Profit Maximization and Price Discrimination"

Modern frameworks, such as Hadoop, combined with abundance of computing resources from the cloud, offer a significant opportunity to address long standing challenges in distributed processing. Infrastructure-as-a-Service clouds reduce the investment cost of renting a large data center while distributed processing frameworks are capable of efficiently harvesting the rented physical resources. Yet, the performance users get out of these resources varies greatly because the cloud hardware is shared by all users. The value for money cloud consumers achieve renders resource sharing policies a key player in both cloud performance and user satisfaction. In the work we present here, we employ microeconomics to direct the allotment of cloud resources for consumption in highly scalable master-worker virtual infrastructures. Our approach is developed on two premises: the cloud-consumer always has a budget and cloud physical resources are limited. Using our approach, the cloud administration is able to maximize per-user financial profit. We show that there is an equilibrium point at which our method achieves resource sharing proportional to each user’s budget. Ultimately, this approach allows us to answer the question of how many resources a consumer should request from the seemingly endless pool provided by the cloud.


8 Απριλίου (Παρασκευή, 4:30μμ) / Αίθουσα Α56
Alan Dix (U. Lancaster και Talis)
"Web of Data, Web of People, Web of Action"

Πραγματική περίληψη: Ο Alan Dix εμφανίστηκε σήμερα απροειδοποίητα στο Τμήμα και, για τιμωρία του, αρπάζουμε την ευκαιρία να δώσει ομιλία.

Εναλλακτική περίληψη: Computers only exist because they do things for people. From human readable web pages, to formal semantics of linked data and the emergent social semantics of tags and folksonomies, we routinely look to the web as both a source of information and a place to put data. However, the web is also a locus of action: users want to get things done, whether booking a hotel room, or editing an online spreadsheet. The boundaries between web and desktop interaction are blurring. On the one hand, the traditional PC desktop is now inhabited by widgets such as the Mac Dashboard, web fast-download apps such as Java Web Start or Adobe Air, and expanded browser functionality such as Chrome. On the other hand, computation and applications that once were part of the desktop are now hosted on the web (for example word-processing with Google Docs), and various technologies enable web applications to function even when users have no connectivity to the internet. Furthermore, in emerging markets such as India and China, this convergence will be total, as the sole computing experience for many will be through mobile devices and predominantly the web. This talk will explore the premise that this emerging web will be a place of action, not just information, and that the purpose of global data is ultimately to serve human needs.


15 Απριλίου (Παρασκευή, 4:00μμ) / Αίθουσα Α56
Χαράλαμπος Νικολάου (ΕΚΠΑ)
"Αναζήτηση με Λέξεις-Κλειδιά σε Βάσεις Δεδομένων RDF"

Παρουσιάζουμε τη σχεδίαση και υλοποίηση ενός συστήματος επεξεργασίας ερωτημάτων με χρήση λέξεων-κλειδιών για το μοντέλο RDF. Το σύστημα χρησιμοποιεί μία γλώσσα ερωτημάτων βασισμένη σε λέξεις-κλειδιά, την οποία επεκτείνει με χρονικές λέξεις-κλειδιά όπως οι 13 χρονικές σχέσεις του Allen: before, after, overlaps, etc. Το μοντέλο δεδομένων του συστήματος έχει τη δυνατότητα αναπαράστασης αόριστης χρονικής πληροφορίας ορίζοντας τα χρονικά όρια μέσα στα οποία ένα συγκεκριμένο γεγονός είναι έγκυρο. Η αόριστη πληροφορία που αφορά σε ένα χρονικό σημείο εκφράζεται ως ένα χρονικό διάστημα μέσα στο οποίο το χρονικό σημείο θα πρέπει να ανήκει. Στην περίπτωση της αόριστης πληροφορίας για χρονικά διαστήματα, το αρχικό και τελικό χρονικό σημείο του διαστήματος εκφράζεται με τον ίδιο τρόπο. Αξιολογούμε το σύστημα ως προς την αποδοτικότητα και αποτελεσματικότητα, δηλ., κλιμάκωση, χρονική απόκριση απάντησης ερωτημάτων, και ποιότητα αποτελεσμάτων. Η πειραματική αξιολόγηση του συστήματος βασίζεται σε 3 σύνολα δεδομένων που παρουσιάζουν διαφορετικά ποιοτικά χαρακτηριστικά. Τέλος, μελετούμε σχετικές εργασίες γύρω από το πρόβλημα της αναζήτησης με λέξεις-κλειδιά σε δομιμένα και ημι-δομημένα δεδομένα, και παρουσιάζουμε τις πιο πρόσφατες μεθοδολογίες αξιολόγησης τέτοιων τεχνικών. Τοποθετούμε την εργασία μας σε αυτό το πλαίσιο και παρουσιάζουμε νέες προκλήσεις που οι επόμενες ερευνητικές προσπάθειες θα πρέπει να επιληφθούν.


15 Απριλίου (Παρασκευή, 4:30μμ) / Αίθουσα Α56
Εμμανουήλ Καρπαθιωτάκης (ΕΚΠΑ)
"Σχεδίαση και Υλοποίηση ενός Μητρώου για το Σημασιολογικό Πλέγμα Αισθητήρων"

Στα πλαίσια αυτής της διπλωματικής εργασίας ασχολούμαστε με το πρόβλημα της καταχώρησης και ανακάλυψης αισθητήρων, υπηρεσιών σχετικών με αισθητήρες, και άλλων σχετικών πηγών πληροφορίας στο Σημασιολογικό Πλέγμα Αισθητήρων. Δείχνουμε πως μπορεί να υλοποιηθεί ένα Σημασιολογικό Μητρώο για την αποθήκευση και χειρισμό μεταδεδομένων τα οποία περιγράφουν πόρους όπως οι παραπάνω. Από τη στιγμή που τα χωρικά και χρονικά μεταδεδομένα χρησιμοποιούνται άμεσα για την περιγραφή αισθητήρων και άλλων σχετικών πηγών πληροφορίας ή υπηρεσιών, χρειαζόμαστε ένα μοντέλο δεδομένων ικανό να αναπαραστήσει τέτοια μεταδεδομένα. Συνεπώς, κάναμε χρήση μιας υλοποίησης του μοντέλου δεδομένων stRDF και της γλώσσας επερωτήσεων stSPARQL. Το μοντέλο stRDF επεκτείνει το RDF με τη δυνατότητα αναπαράστασης χωρικών και χρονικών μεταδεδομένων με τη χρήση γραμμικών περιορισμών. Η stSPARQL επεκτείνει την SPARQL, επιτρέποντας έτσι τις επερωτήσεις για stRDF μεταδεδομένα. Δείχνουμε πως μπορεί να χρησιμοποιηθεί το Strabon, ένα σύστημα για αποθήκευση και αποτίμηση επερωτήσεων για stRDF/stSPARQL, για την υλοποίηση ενός Σημασιολογικού Μητρώου.


20 Μαΐου (Παρασκευή, 4:00μμ) / Αίθουσα Α56
Olivier Ballet (DXT)
"Inscape: An Authoring and Experiencing Environment for Virtual Storytelling"

This talk will present the genesis of the INSCAPE system developed in the frame of the eponym FP6 Integrated Project. This project researched and implemented an innovative authoring platform for both the creation and experiencing of multiple forms of interactive stories.


23 Μαΐου (Δευτέρα, 10:00πμ) / Αίθουσα Α56
Κώστας Σαΐδης (ΕΚΠΑ)
"Ιδεατοί Χώροι Πληροφορίας: Επέκταση και Ενοποίηση Ετερογενών Συλλογών Δεδομένων και Συναφών Συστημάτων"

Οι χρήστες προσδοκούν ότι οι εφαρμογές θα αντεπεξέλθουν στη συνεχή αύξηση της πληροφορίας, υποστηρίζοντας την προσθήκη νέων, συχνά μη αναμενόμενων, πηγών και συλλογών δεδομένων. Ταυτόχρονα, η αυξημένη συνδεσιμότητα που προσφέρει η επέκταση του Διαδικτύου, οδηγεί τους χρήστες να αποζητούν τη χρήση της ίδιας πληροφορίας σε πολλές εφαρμογές. Στην παρούσα διατριβή επιχειρούμε να αντιμετωπίσουμε την κοινή πρόκληση που βρίσκεται πίσω από τις παραπάνω ανάγκες επέκτασης, ενοποίησης και διαλειτουργικότητας της πληροφορίας, το πώς, δηλαδή, θα αυτοματοποιηθεί η προσθήκη νέων δεδομένων στις υπάρχουσες εφαρμογές. Συγκεκριμένα, για την αποφυγή των χρονοβόρων και δαπανηρών αλλαγών που επιφέρουν οι παραπάνω ανάγκες στον πηγαίο κώδικα των εφαρμογών, ακυρώνοντας και καταργώντας πολλές φορές την υφιστάμενη υλοποίηση, προτείνουμε τη θέσπιση ιδεατών χώρων πληροφορίας (virtual information spaces), εισάγοντας την έννοια του ιδεατού αντικειμένου (virtual object). Η προσέγγισή μας αποσκοπεί στην άρση των εμποδίων που επιβάλλουν οι ετερογενείς αναπαραστάσεις, μορφές και πρωτόκολλα δεδομένων και βασίζεται στην ακόλουθη επιδίωξη. Αν καταφέρουμε να απομονώσουμε την ``ουσία των δεδομένων'' από τις ``υλοποιημένες μορφές των δεδομένων'' που χρησιμοποιούν οι εφαρμογές, θα αυτοματοποιήσουμε την απόσπαση της πληροφορίας από τη μία εφαρμογή και την επισύναψή της σε μια άλλη. Τα ιδεατά αντικείμενα τοποθετούνται εννοιολογικά μεταξύ της επιχειρησιακής λογικής και των πηγών δεδομένων της εφαρμογής, για να προσφέρουν μια κοινή, επαναχρησιμοποιούμενη και συνθέσιμη ερμηνεία των δεδομένων κατά τον χρόνο εκτέλεσης, η οποία υπερβαίνει το πλαίσιο της εφαρμογής. Από τη μία, τα ιδεατά αντικείμενα διευκολύνουν την αποτελεσματική επέκταση μιας εφαρμογής με την υποστήριξη νέων ειδών πληροφορίας, χωρίς την τροποποίηση του πηγαίου της κώδικα. Από την άλλη, το μοντέλο των ιδεατών αντικειμένων μπορεί να διασυνδέσει διαφορετικούς ιδεατούς χώρους, αυτοματοποιώντας την επαναχρησιμοποίηση της πληροφορίας μεταξύ διαφορετικών εφαρμογών. Αναμένουμε ότι η προσέγγισή μας θα αποδειχθεί χρήσιμη για τις επικεντρωμένες στα δεδομένα εφαρμογές, παρουσιάζοντας πώς τα ιδεατά αντικείμενα συνετέλεσαν (α) στην αποδοτική ανάπτυξη και σταδιακή επέκταση ενός παραγωγικού συστήματος ψηφιακής βιβλιοθήκης και (β) στην αποτελεσματική υλοποίηση ενός πραγματικού σεναρίου διαλειτουργικότητας, επιτρέποντας σε ψηφιακές συλλογές να υπερβούν τα όρια των εφαρμογών. Τέλος, τα πειράματά μας καταδεικνύουν ότι η προσέγγισή μας επιβάλλει ελάχιστες καθυστερήσεις σε θέματα απόδοσης καθώς η κλιμάκωση των ιδεατών αντικειμένων είναι ανάλογη των δυνατοτήτων κλιμάκωσης των υποκείμενων συστημάτων αποθήκευσης, ακόμη και σε περιπτώσεις ετερογενών πηγών δεδομένων.


27 Μαΐου (Παρασκευή, 4:00μμ) / Αίθουσα Α56
Χεράλντ Κλλάπι (ΕΚΠΑ)
"Schedule Optimization for Data Processing Flows on the Cloud"

Scheduling data processing workflows (dataflows) on the cloud is a very complex and challenging task. It is essentially an optimiza- tion problem, very similar to query optimization, that is character- istically different from traditional problems in two aspects. First, its space of alternative schedules is very rich, due to various opti- mization opportunities that cloud computing offers. Second, its op- timization criterion is at least two-dimensional, with the monetary cost of using the cloud being at least as important as the query com- pletion time. In this paper, we study the scheduling of dataflows that involve arbitrary data processing operators in the context of three different problems: 1) minimize completion time given a fixed budget, 2) minimize monetary cost given a time limit, and 3) find trade-offs between completion time and monetary cost without any a-priori constraints. We formulate the problems and present an approximate optimization framework to address them that makes use of resource elasticity in the cloud. To investigate the effective- ness of our approach, we incorporate the devised framework into a prototype system for dataflow evaluation and instantiate it with several greedy, probabilistic, and exhaustive search algorithms. Fi- nally, we present the results of several experiments that we have conducted with the prototype elastic optimizer on numerous sci- entific and synthetic dataflows and we identify the advantages and disadvantages of the various search algorithms. The overall results are quite promising and indicate the effectiveness of our approach.


27 Μαΐου (Παρασκευή, 4:30μμ) / Αίθουσα Α56
Μανώλης Γιαννισάκης - Πάνος Παπαδάτος (ΕΚΠΑ)
"Το Διαδικτυακό Eκπαιδευτικό Παιχνίδι Επαυξημένης Πραγματικότητας ARcropolis"

Το θέμα αυτής της ομιλίας είναι η παρουσίαση του παιχνιδιού ARcropolis. Το ARcropolis είναι ένα διαδικτυακό παιχνίδι εκπαιδευτικού χαρακτήρα που χρησιμοποιεί Επαυξημένη Πραγματικότητα ως βασικό τρόπο αλληλεπίδρασης. Αναλυτικότερα, θα εξηγήσουμε τη βασική ιδέα του παιχνιδιού, το πώς παίζεται και τις τεχνολογίες που χρησιμοποιήσαμε. Τέλος, όσοι από το ακροατήριο το επιθυμούν, θα μπορούν να δοκιμάσουν το παιχνίδι.


3 Ιουνίου (Παρασκευή, 3:00μμ) / Αίθουσα Α56
Παναγιώτης Λιάκος (ΕΚΠΑ)
"Θεματικά Εστιασμένη Προσκομιδή Ιστοσελίδων από τον Κρυμμένο Παγκόσμιο Ιστό"

Ένα συνεχώς αυξανόμενο πλήθος υψηλής ποιότητας πληροφορίας είναι αποθηκευμένο σε σελίδες που έρχονται από τον Κρυμμένο Παγκόσμιο Ιστό (Hidden Web). Τέτοιες σελίδες είναι προσβάσιμες μόνο μέσω μιας διεπαφής επερωτήσεων που παρέχεται από τους Κρυμμένους Ιστότοπους και μπορεί να εκτείνονται σε μία ποικιλία θεμάτων. Προκειμένου να παρασχεθεί κεντρικοποιημένη πρόσβαση στον Κρυμμένο Παγκόσμιο Ιστό, οι προηγούμενες προσπάθειες είχαν επικεντρωθεί στην ανάπτυξη τεχνικών παραγωγής επερωτήσεων ( queries) που στοχεύουν στην λήψη ενός ολόκληρου Κρυμμένου ιστότοπου με το μικρότερο κόστος. Σε ορισμένες περιπτώσεις όμως, μας ενδιαφέρει η λήψη μόνο ενός συγκεκριμένου κομματιού ενός τέτοιου ιστότοπου. Για παράδειγμα, σε μία ειδησεογραφική βάση δεδομένων, έναν χρήστης μπορεί να ενδιαφέρεται για την ανάκτηση μόνο των αθλητικών άρθρων και όχι των πολιτικών. Σε αυτή την περίπτωση, πρέπει να κάνουμε την καλύτερη δυνατή χρήση των πόρων μας κατεβάζοντας μόνο το τμήμα του Κρυμμένου ιστότοπου που μας ενδιαφέρει.Στην εργασία αυτή, ερευνούμε το πως μπορούμε να αναπτύξουμε μια θεματικά εστιασμένη εφαρμογή προσκομιδής κρυμμένων ιστοσελιδών (Topic-Sensitive Hidden Web Crawler) που μπορεί αυτόνομα να εξάγει θεματικές σελίδες από τον Κρυμμένο Παγκόσμιο Ιστό, αναζητώντας μόνο στο υποσύνολο που είναι σχετικό με την αντίστοιχη κατηγορία. Για το σκοπό αυτό, παρουσιάζουμε τεχνικές παραγωγής επερωτήσων που λαμβάνουν υπόψη τους το θέμα το οποίο μας ενδιαφέρει. Προτείνουμε έναν πλήθος από διαφορετικές πολιτικές συγκομιδής ιστοσελίδων και τις αξιολογούμε πειραματικά με δεδομένα απο ένα δημοφιλή ιστότοπο.


27 Ιουνίου (Δευτέρα, 4:00μμ) / Αίθουσα Α56
Huseyin Akcan (Izmir University of Economics)
"GPS-Free Localization in Wireless Networks"

Location based systems focus on finding the locations of items, cars, data, or people, and have been gaining a lot of interest in the research community lately. The problem is widely known as the localization problem in the wireless network community. Accurate discovery of the real-time locations of objects is the key element to the success of many applications ranging from tracking, surveillance, search-and-rescue missions to traffic control, collision avoidance, and smart cars. Traditionally, position information has been gathered using global positioning systems (GPS). However, these systems in general suffer from two major drawbacks, they cannot be used indoors, and if the nodes are in a small area, such as in a room, GPS based localization schemes do not provide enough accuracy.The limitations of the global positioning systems has led the research community to start looking into GPS-free localization methods. A good alternative for localization that uses only local resources is the ranging based localization algorithms, where nodes only use neighborhood graph and the ranges to their immediate one-hop neighbors to perform localization. In this talk, we will briefly outline the idea behind localization, its limitations, and the theoretical foundations of the network localization in the rigidity theory. We will also survey some of the state of the art GPS-free localization algorithms for static and mobile networks.


1 Ιουλίου (Παρασκευή, 3:00μμ) / Αίθουσα Α56
Κατερίνα Παπαντωνίου (ΕΚΠΑ)
"Εφαρμογές και Τεχνολογίες του Σημασιολογικού Ιστού στα Συστήματα Ερωταποκρίσεων"

Η ταχύτατη αύξηση της πληροφορίας που προσφέρεται μέσω του Σημασιολογικού Ιστού (Semantic Web) τα τελευταία χρόνια καθιστά επιτακτική τη μελέτη αποτελεσματικών τρόπων αναζήτησης, που θα διαχειρίζονται αποτελεσματικά και με φιλικό προς τον τελικό χρήστη τρόπο αυτόν τον ετερογενή και τεράστιο όγκο πληροφορίας. Προς αυτή την κατεύθυνση, υπάρχει ένα αυξανόμενο ενδιαφέρον για τα συστήματα ερωταποκρίσεων που εκμεταλλεύονται τη δομημένη σημασιολογική πληροφορία για την εξαγωγή απαντήσεων. Η παρούσα εργασία έχοντας σαν αφετηρία αυτό το αυξανόμενο ερευνητικό ενδιαφέρον έχει σαν στόχο την υλοποίηση ενός συστήματος που θα εκμεταλλεύεται τεχνολογίες και εφαρμογές του Σημασιολογικού Ιστού για να καλύψει πληροφοριακές ανάγκες των χρηστών που εκφράζονται μέσω φυσικής γλώσσας. Το σύστημα αποτελείται από δυο υποσυστήματα και καλύπτει ερωτήσεις που αφορούν πρόσωπα. Το πρώτο υποσύστημα αφορά απλές (factoid) ερωτήσεις και ερωτήσεις λιστών και το δεύτερο καλύπτει βιογραφικές ερωτήσεις. Συνδετικός ιστός και για τα δυο υποσυστήματα είναι η χρήση της DBPedia που είναι μια από τις πιο επιτυχημένες εφαρμογές του Σημασιολογικού Ιστού.


1 Ιουλίου (Παρασκευή, 3:30μμ) / Αίθουσα Α56
Δημήτρης Μπηλίδας (ΕΚΠΑ)
"Σημασιολογία της Γλώσσας Ενημερώσεων RUL"

Η εργασία ασχολείται με τη σημασιολογία της γλώσσας ενημερώσεων RUL. Η RUL είναι μια γλώσσα ενημερώσεων για οντολογίες του σημασιολογικού ιστού εκφρασμένες σε RDF(S). Προκειμένου να δώσουμε τη σημασιολογία της RUL χρησιμοποιούμε μια μέθοδο που αφορά την εξέλιξη οντολογιών και δίνει με τυπικό τρόπο το αποτέλεσμα που έχει μια αλλαγή σε μια οντολογία. Η συγκεκριμένη μέθοδος χρησιμοποιείται εδώ τροποποιημένη κατάλληλα έστι ώστε το αποτέλεσμα που δίνει η γλώσσα RUL να είναι ακριβώς το ίδιο με το αποτέλεσμα της μεθόδου και έτσι η σημασιολογία της RUL να δίνεται επακριβώς με τυπικό τρόπο μέσω της συγκεκριμένης μεθόδου.


21 Ιουλίου (Πέμπτη, 2:00μμ) / Αίθουσα Α56
Ίρις Μηλιαράκη (ΕΚΠΑ)
"Κατανεμημένη Διήθηση Και Διάχυση XML Δεδομένων σε Συστήματα Ομοτίμων Κόμβων"

Τα συστήματα δημοσιεύσεων/συνδρομών (publish/subscribe systems) ή αλλιώς τα συστήματα διήθησης δεδομένων (filtering systems) αποτελούν μια ευρέως διαδεδομένη πρόταση στις μέρες μας. Τέτοια συστήματα έχουν διάφορες ενδιαφέρουσες και χρήσιμες εφαρμογές όπως οι ειδοποιήσεις για ειδήσεις ή δημοσιεύσεις ψηφιακών βιβλιοθηκών αλλά και για οποιαδήποτε άλλη πληροφορία μπορεί να ενδιαφέρεται ένας χρήστης. Δεδομένου ότι το μοντέλο XML έχει καθιερωθεί για την μορφοποίηση και την ανταλλαγή δεδομένων στο διαδίκτυο, μεγάλο μέρος της έρευνας στην περιοχή αυτή έχει επικεντρωθεί στον σχεδιασμό αποδοτικών συστημάτων για την διήθηση δεδομένων XML. Για να επιτύχουμε αποδοτική διήθηση δεδομένων XML σε μεγάλη κλίμακα και να αποφύγουμε τα συνήθη προβλήματα που εμφανίζουν οι συγκεντρωτικές προσεγγίσεις, πρέπει να οδηγηθούμε στην ανάπτυξη μιας τέτοια υπηρεσίας σε ένα κατανεμημένο περιβάλλον.

Στα πλαίσια της διατριβής, σχεδιάσαμε, υλοποιήσαμε και αξιολογήσαμε πειραματικά ένα κατανεμημένο σύστημα που ονομάστηκε FoXtrot. Η πρόταση μας συνδυάζει ένα μη αιτιοκρατικό αυτόματο για αποδοτική διήθηση δεδομένων XML καθώς και τους κατανεμημένους πίνακες κατακερματισμού (distributed hash tables) για ένα πλήρως κατανεμημένο και κλιμακωτό σύστημα. Η βασική ιδέα αυτής της εργασίας είναι η κατανομή του αυτόματου στους κόμβους του δικτύου και η εκτέλεση παράλληλων ανεξάρτητων υπολογισμών που μας προσφέρει η ιδιότητα της μη-αιτιοκρατίας. Εκτός από τις τεχνικές που παρουσιάζονται για το δομικό ταίριασμα (structural matching) των δεδομένων XML και για τις οποίες χρησιμοποιούμε το αυτόματο που περιγράψαμε, προτείνουμε και διάφορες εναλλακτικές τεχνικές για το ταίριασμα των τιμών (value matching) που περιλαμβάνονται στα δεδομένα XML με στόχο την κατανομή του φόρτου και αυτής της εργασίας.

Τέλος, πραγματοποιήσαμε μια εκτενή πειραματική αξιολόγηση του συστήματος FoΧtrot τόσο σε ένα ελεγχόμενο περιβάλλον όσο και σε ένα ρεαλιστικό περιβάλλον μεγάλης κλίμακας που παρέχεται από το PlanetLab. Με βάση την αξιολόγηση προκύπτει ότι το σύστημα FoXtrot επιτυγχάνει υψηλές επιδόσεις τόσο για την αποθήκευση των ερωτήσεων στο κατανεμημένο αυτόματο όσο και για την διήθηση και διάχυση των δεδομένων XML. Επιπλέον, είναι χαρακτηριστικό της δυνατότητας κλιμάκωσης του συστήματος ότι η αύξηση του μεγέθους του δικτύου που εκτελείται το FoXtrot οδηγεί σε αισθητή βελτίωση της απόδοσης του συστήματος.


21 Ιουλίου (Πέμπτη, 4:00μμ) / Αίθουσα Α56
Ζωή Καούδη (ΕΚΠΑ)
"Κατανεμημένη Αποτίμηση Επερωτήσεων και Συλλογιστική για το Μοντέλο RDF σε Δίκτυα Ομότιμων Κόμβων"

Με το ενδιαφέρον για τις εφαρμογές του Σημασιολογικού Ιστού να αυξάνεται ραγδαία, το μοντέλο RDF και RDFS έχει γίνει ένα από τα πιο ευρέως χρησιμοποιούμενα μοντέλα δεδομένων για την αναπαράσταση και την ενσωμάτωση δομημένης πληροφορίας στον Ιστό. Το πλήθος των διαθέσιμων πηγών πληροφορίας RDF συνεχώς αυξάνεται με αποτέλεσμα να υπάρχει μια επιτακτική ανάγκη για τη διαχείριση RDF δεδομένων. Σε αυτή τη διατριβή επικεντρωνόμαστε στην κατανεμημένη διαχείριση RDF δεδομένων σε δίκτυα ομότιμων κόμβων. Σχεδιάζουμε και υλοποιούμε το σύστημα Atlas, ένα πλήρως κατανεμημένο σύστημα για την αποθήκευση RDF και RDFS δεδομένων, την αποτίμηση και βελτιστοποίηση επερωτήσεων στη γλώσσα SPARQL και τη συλλογιστική στο μοντέλο RDFS. Το σύστημα Atlas χρησιμοποιεί κατανεμημένους πίνακες κατακερματισμού, μια δημοφιλή περίπτωση συστημάτων ομότιμων κόμβων. Αρχικά, αναλύουμε κατανεμημένους αλγόριθμους για συλλογιστική RDFS χρησιμοποιώντας κατανεμημένους πίνακες κατακερματισμού. Υλοποιηούμε διάφορες παραλλαγές των αλγορίθμων προς τα εμπρός αλυσίδα εκτέλεσης (forward chaining) και προς τα πίσω αλυσίδα εκτέλεσης (backward chaining) και υλοποιούμε έναν αλγόριθμο που χρησιμοποιεί την τεχνική μετασχηματισμού των κανόνων σε μαγικό σύνολο (magic sets transformation). Αποδεικνύουμε θεωρητικά την ορθότητα των αλγορίθμων αυτών και προσφέρουμε μια συγκριτική μελέτη τόσο αναλυτικά όσο και πειραματικά. Στο πειραματικό μέρος της μελέτης αυτής, αναπτύσουμε το σύστημα στο PlanetLab και σε μια τοπική συστάδα υπολογιστών. Παράλληλα, προτείνουμε αλγορίθμους και τεχνικές για την αποτίμηση και τη βελτιστοποίηση επερωτήσεων στη γλώσσα SPARQL για RDF δεδομένα που είναι αποθηκευμένα σε κατανεμημένους πίνακες κατακερματισμού. Οι τεχνικές βελτιστοποίησης βασίζονται σε εκτιμήσεις επιλεκτικότητας και έχουν στόχο τη μείωση του χρόνου απόκρισης της επερώτησης καθώς και της κατανάλωσης εύρους ζώνης του δικτύου. Η εκτεταμένη πειραματική αξιολόγηση των μεθόδων βελτιστοποίησης γίνεται σε μια τοπική συστάδα υπολογιστών χρησιμοποιώντας ένα ευρέως διαδεδομένο σημείο αναφοράς μετρήσεων.