[Themen]
[Dozent]
[Termine]
[Materialien]
[Voraus.]
[Scheine]
MARTIN-LUTHER-UNIVERSITÄT HALLE-WITTENBERG
Institut für Informatik
Prof. Dr. Stefan Brass
Seminar über Datenbanken
(Sommersemester 2008)
Das Seminar findet am 28.07. und 29.07. in Raum 304 statt,
und ggf. am 30.07. vormittags in Raum 1.26.
Die Vorbesprechung fand am Dienstag, 8. April,
12:15-13:45, im Raum 1.16 (Von-Seckendorff-Platz 1).
Folien:
[Postscript, S/W, verkleinert]
[PDF, farbig, gross]
Das Seminar ist voll,
mit 21 Teilnehmern schon überbelegt.
Weitere Teilnehmer könnten höchstens
in extremen Ausnahmefällen akzeptiert werden.
Wenn Sie mir wegen des Seminars eine EMail schicken,
schreiben Sie bitte in die Betreff-Zeile (neben möglichweise
anderen Informationen) auch den String "[sem08]".
So kann ich die EMails leichter finden.
Weitere Vortragsthemen werden nach und nach auf dieser Seite
veröffentlicht.
Dozent
Dr. Stefan Brass
- Büro:
-
Raum 313 (Institut für Informatik, Von-Seckendorff-Platz 1)
- Sprechstunde:
-
Mittwochs, 12:00-13:00 (wird sich im Sommersemester ändern!)
- Email:
-
brass@acm.org
- Telefon:
-
0345/55-24740 (Büro),
0345/2036337 (zu Hause, möglichst nur 8-13, 16-21)
- Fax:
-
0345/55-27333 (im Sekretariat)
- Sekretariat:
-
Frau Vahrenhold, Telefon 0345/55-24750, Zimmer 324
(Dienstags nicht besetzt)
Termine
- Zeit: Dienstags, 12-14.
Vermutlich wird das Seminar aber
als Blockveranstaltung nach dem Semester
durchgeführt.
Diese mögliche Terminänderung
wird bei der Vorbesprechung am ersten Dienstag des Semesters
diskutiert (8. April).
- Beginn: Voraussichtlich werden die Themen noch in den Semesterferien
vergeben.
In der ersten Semesterwoche gibt es eine Vorbesprechung.
- Ort: (steht noch nicht fest)
Es wird Themen aus folgenden Bereichen geben:
- Implementierung von Datenbank-Managementsystemen
- Datenbankentwurf
- Deduktive Datenbanken
- Eventuell XML und Datenbanken
- Eventuell Semantisches Web
Die genauen Themen sind in Arbeit und werden hier
nach und nach ins Netz gestellt.
Ich hoffe,
bis zum 4. März hier 14 Themen
(entsprechend der maximalen Teilnehmerzahl) anzubieten.
- Cache-Sensitive Hauptspeicher-Datenstruktur für Relationen,
Clustered Hash-Join
[vergeben]
- Cache-Effiziente Hauptspeicher-Variante von B-Bäumen
[vergeben]
- Jun Rao, Kenneth A. Ross:
Making B+- trees cache conscious in main memory.
Proceedings of the 2000 ACM SIGMOD international conference on
Management of data, pages 475-486.
[Eintrag in der ACM Digital Library]
- Richard A. Hankins, Jignesh M. Patel:
Effect of node size on the performance of cache-conscious B+-trees.
Proceedings of the 2003 ACM SIGMETRICS international conference on
Measurement and modeling of computer systems, pages 283-294.
[Eintrag in der ACM Digital Library]
- Jun Rao, Kenneth A. Ross:
Cache Conscious Indexing for Decision-Support in Main Memory.
Proceedings of the 25th International Conference on
Very Large Data Bases, 1999, pages 78-89.
[Eintrag auf www.vldb.org]
- B-Bäume und Caching in CPUs
[vergeben]
- Goetz Graefe:
B-tree indexes, interpolation search, and skew.
Proceedings of the 2nd international workshop on Data management
on new hardware, 2006
[Eintrag in der ACM Digital Library
(Uni Halle hat Zugriff)]
- Goetz Graefe and Per-Ake Larson:
B-tree Indexes and CPU Caches.
Data Engineering, 2001. Proceedings.
(17th International Conference on Data Engineering),
Pages:349 - 358.
[IEEE Digital Library (kostenpflichtig)]
- David Lomet:
The evolution of effective B-tree: page organization and techniques:
a personal account.
ACM SIGMOD Record, Volume 30, Issue 3 (September 2001)
Pages: 64 - 69.
[Eintrag in der ACM Digital Library
(Uni Halle hat Zugriff)]
- David Lomet:
B-tree page size when caching is considered.
ACM SIGMOD Record, Volume 27, Issue 3 (September 1998),
Pages: 28 - 32.
[Eintrag in der ACM Digital Library
(Uni Halle hat Zugriff)]
Es geht sicher nicht darum,
den gesamten Inhalt dieser Artikel im Vortrag wiederzugeben.
Vielmehr soll die grundlegende Problematik klar werden,
und aus den genannten Ideen eine gewisse Auswahl vorgestellt werden.
- Effiziente Änderung von B-Bäumen
[vergeben]
- Online-Reorganisation von B-Baum Indexen
[vergeben]
- Chendong Zou, Betty Salzberg:
On-line reorganization of sparsely-populated B+-trees.
In SIGMOD'96 (Proceedings of the 1996 ACM SIGMOD
international conference on Management of data):
ACM SIGMOD Record, Volume 25, Issue 2 (June 1996),
Pages: 115-124.
[Eintrag in der ACM Digital Library]
- Index-Organized Tables in Oracle
[vergeben]
- Eugene Inseok Chong, Jagannathan Srinivasan, Souripriya Das,
Chuck Freiwald, Aravind Yalamanchi, Mahesh Jagannath, Anh-Tuan Tran,
Ramkumar Krishnan, Richard Jiang:
A mapping mechanism to support bitmap index
and other auxiliary structures on tables stored as primary B+-tree.
ACM SIGMOD Record, Volume 32 , Issue 2 (June 2003), Pages: 78-88
[Eintrag in der ACM Digital Library]
- Jagannathan Srinivasan,
Souripriya Das,
Chuck Freiwald,
Eugene Inseok Chong,
Mahesh Jagannath,
Aravind Yalamanchi,
Ramkumar Krishnan,
Anh-Tuan Tran,
Samuel DeFazio,
Jayanta Banerjee:
Oracle8i Index-Organized Table and Its Application to New Domains.
VLDB 2000, Proceedings of 26th International Conference on Very
Large Data Bases,
Pages 285-296.
[Electronic Edition auf vldb.org]
- Eugene Inseok Chong,
Souripriya Das,
Chuck Freiwald,
Jagannathan Srinivasan,
Aravind Yalamanchi,
Mahesh Jagannath,
Anh-Tuan Tran,
Ramkumar Krishnan:
B+-Tree Indexes with Hybrid Row Identifiers in Oracle8i.
17th International Conference on Data Engineering (ICDE'01), 2001.
[Eintrag in der IEEE Digital Library]
(Abruf der PDF-Datei ist kostenpflichtig,
wenden Sie sich an den Betreuer)
- Diag-Join
[vergeben]
- Sven Helmer, Till Westmann, Guido Moerkotte:
Diag-Join: An Opportunistic Join Algorithm for 1:N Relationships.
In VLDB'98 ( Proceedings of 24rd International Conference on Very
Large Data Bases), Morgan Kaufmann, 1998,
pages 98-109.
[Webseite in vldb.org]
- OPT++: Ein erweiterbarer Anfrageoptimierer
[vergeben]
- Navin Kabra, David J. DeWitt:
OPT++ : an object-oriented implementation for
extensible database query optimization.
The VLDB Journal -- The International Journal on Very Large Data Bases,
Volume 8, Issue 1 (April 1999), Pages: 55-78.
[Eintrag in der ACM Digital Library]
- Fortgeschrittene Anfrageoptimierung in DB2
[vergeben]
- Hamid Pirahesh, Joseph M. Hellerstein, Waqar Hasan:
Extensible/Rule Based Query Rewrite Optimization in Starburst.
Proc. SIGMOD Conference, 39-48, 1992.
[Postscript]
- Qi Cheng, Jarek Gryz, Fred Koo, Cliff Leung, Linqi Liu,
Xiaoyan Qian, Bernhard Schiefer:
Implementation of Two Semantic Query Optimization Techniques
in DB2 Universal Database.
Proceedings of the 25th VLDB Conference, 687-698, 1999.
[Postscript]
- T. Y. Cliff Leung, Hamid Pirahesh, Praveen Seshardi,
Joseph M. Hellerstein:
Query Rewrite Optimization Rules in IBM DB2 Universal Database.
In: Michael Stonebraker, Joseph M. Hellerstein:
Readings in Database Systems, 3rd Ed., 153-168.
Technical Report, IBM RJ10103, Research Lab, San Jose, CA.
- DB2 Database for Linux, UNIX, and Windows Information Center
[Query Rewrite Optimization Guidelines]
- LEO: DB2's lernender Optimierer
[vergeben]
- Michael Stillger, Guy M. Lohman, Volker Markl, Mokhtar Kandil:
LEO - DB2's LEarning Optimizer.
VLDB 2001, Proceedings of 27th International Conference
on Very Large Data Bases, 19-28.
[PDF-Datei von www.vldb.org]
- V. Markl, G. M. Lohman, V. Raman:
LEO: An autonomic query optimizer for DB2.
IBM Systems Journal, Volume 42, Number 1, Page 98-106, 2003.
[PDF]
- Ashraf Aboulnaga, Surajit Chaudhuri:
Self-tuning histograms:
building histograms without looking at data.
SIGMOD '99: Proceedings of the 1999 ACM SIGMOD international
conference on Management of data, Pages: 181 - 192.
[Eintrag in der ACM Digital Library]
- Ashraf Aboulnaga, Peter J. Haas, Sam Lightstone, Guy M. Lohman,
Volker Markl, Ivan Popivanov, Vijayshankar Raman:
Automated Statistics Collection in DB2 UDB.
VLDB 2004, pages 1146-1157.
[PDF]
- OLAP-Unterstützung in DB2, Data Cube
[vergeben]
- N. Colossi, W. Malloy, B. Reinwald:
Relational extensions for OLAP.
IBM Systems Journal, Volume 41, Number 4, Pages 714-731 (2002)
[IBM Systems Journal:
Eintrag für diesen Artikel (PDF)]
- Jim Gray, Surajit Chaudhuri, Adam Bosworth, Andrew Layman,
Don Reichart, Murali Venkatrao, Frank Pellow, Hamid Pirahesh:
Data Cube: A Relational Aggregation Operator Generalizing Group-By,
Cross-Tab, and Sub-Totals.
Data Mining and Knowledge Discovery, 1(1), 29-53, 1997.
[CiteSeer]
- XML-Unterstützung in DB2
[noch verfügbar
für Teilnehmer der Zertifizierungs-AG]
- F. Özcan, D. Chamberlin, K. Kulkarni, J.-E. Michels:
Integration of SQL and XQuery in IBM DB2.
IBM Systems Journal, Volume 45 , Issue 2 (January 2006),
Pages: 245 - 270.
[PDF]
[Inhaltsverzeichnis]
- K. Beyer, R. Cochrane, M. Hvizdos, V. Josifovski, J. Kleewein,
G. Lapis, G. Lohman, R. Lyle, M. Nicola, F. Özcan, H. Pirahesh,
N. Seemann, A. Singh, T. Truong, R. C. Van der Linden, B. Vickery,
C. Zhang, and G. Zhang:
DB2 goes hybrid:
Integrating native XML and XQuery with relational data and SQL.
IBM Systems Journal, Volume 45 , Issue 2 (January 2006),
Pages: 271-298.
[PDF]
- XPath: Semantik und effiziente Auswertung
[vergeben]
- Speicherung von XML-Daten in relationalen Datenbanken
[vergeben]
- Masatoshi Yoshikawa, Toshiyuki Amagasa, Takeyuki Shimura,
Shunsuke Uemura:
XRel: a path-based approach to storage and retrieval of XML documents
using relational databases.
ACM Transactions on Internet Technology (TOIT),
Volume 1, Issue 1 (August 2001), Pages: 110-141.
[Eintrag in der ACM Digital Library]
- Native XML Indexierungs Techniken
für die Speicherung von XML-Daten in Relationalen Datenbanken
[noch verfügbar]
- Felix Weigel, Klaus U. Schulz, Holger Meuss:
Exploiting native XML indexing techniques for XML retrieval in
relational database systems.
Proceedings of the 7th annual ACM international workshop on Web
information and data management, 2005, pages 23 - 30.
[Eintrag in der ACM Digital Library]
- Felix Weigel, Klaus U. Schulz, Holger Meuss:
Node Identification Schemes for Efficient XML Retrieval.
In: Frank Neven and Thomas Schwentick and Dan Suciu (Eds.):
Foundations of Semistructured Data,
Dagstuhl Seminar Proceedings, 2005.
[Eintrag in: Dagstuhl Seminar Proceedings]
- Effizienter Export von relationalen Daten als XML
[vergeben]
- Surajit Chaudhuri, Raghav Kaushik, Jeffrey F. Naughton:
On relational support for XML publishing:
beyond sorting and tagging.
Proceedings of the 2003 ACM SIGMOD international conference on
Management of data, 2003, Pages: 611-622.
[Eintrag in der ACM Digital Library]
(Abruf von Uni-Rechnern aus kostenlos)
- Jayavel Shanmugasundaram, Eugene J. Shekita, Rimon Barr,
Michael J. Carey, Bruce G. Lindsay, Hamid Pirahesh,
Berthold Reinwald:
Efficiently Publishing Relational Data as XML Documents.
Proceedings of the 26th International Conference on
Very Large Data Bases, 2000, Pages: 65-76.
[Eintrag auf www.vldb.org]
- Datenbankentwurf für hybride Datenbanken (relational und XML)
[vergeben]
- Mirella M. Moro, Lipyeow Lim, Yuan-Chi Chang:
Schema advisor for hybrid relational-XML DBMS.
Proceedings of the 2007 ACM SIGMOD international conference on
Management of data, Pages: 959 - 970.
[Eintrag in der ACM Digital Library]
- Suchmaschinen-Spam: Übersicht und Statistik
[vergeben]
- Zoltán Gyöngyi, Hector Garcia-Molina:
Spam: It's Not Just for Inboxes Anymore.
Computer, October 2005 (Vol. 38, No. 10), pp. 28-34.
[Eintrag in der IEEE Digital Library]
- Zoltán Gyöngyi, Hector Garcia-Molina:
Web Spam Taxonomy.
In First International Workshop on Adversarial Information Retrieval
on the Web (AIRWeb), 2005.
[PDF]
[Workshop]
- Dennis Fetterly, Mark Manasse, Marc Najork:
Spam, damn spam, and statistics:
using statistical analysis to locate spam web pages.
Proceedings of the 7th International Workshop on the Web and Databases,
2004,
Pages: 1 - 6.
[Eintrag in der ACM Digital Library]
- Alan Perkins: The classification of Search Engin Spam.
silverdisc, White paper, Sept. 2001.
[http://www.silverdisc.co.uk/articles/spam-classification/]
- Suchmaschine-Spam: Cloaking und Redirection
[vergeben]
- Yi-Min Wang, Ming Ma, Yuan Niu, Hao Chen:
Spam double-funnel: connecting web spammers with advertisers.
WWW '07: Proceedings of the 16th international conference on
World Wide Web, Pages: 291-300.
[Eintrag in der ACM Digital Library]
- Baoning Wu, Brian D. Davison:
Cloaking and Redirection: A Preliminary Study.
First International Workshop on Adversarial Information Retrieval
on the Web (AIRWeb'05), 2005.
[AIRWeb'05 Webseite (mit Links zu PDF-Dateien)]
- Baoning Wu, Brian D. Davison:
Detecting semantic cloaking on the web.
Proceedings of the 15th international conference on World Wide Web,
2006, Pages: 819-828.
[Eintrag in der ACM Digital Library]
- Yi-Min Wang; Ming Ma:
Detecting Stealth Web Pages That Use Click-Through Cloaking.
Microsoft Research, Technical Report, MSR-TR-2006-178, 2006.
[Web Seite bei Microsoft Research]
- Kumar Chellapilla, David Maxwell Chickering:
Improving Cloaking Detection using Search Query Popularity
and Monetizability.
Second International Workshop on
Adversarial Information Retrieval on the Web (AIRWeb'2006).
[AIRWeb'2006 Webseite (mit Links zu PDF-Dateien)]
- Kumar Chellapilla, Alexey Maykov:
A taxonomy of JavaScript redirection spam.
[Eintrag in der ACM Digital Library]
- Suchmaschinen-Spam: PageRank und Link-Farmen
[noch verfügbar]
- Ye Du, Yaoyun Shi, Xin Zhao:
Using spam farm to boost PageRank.
AIRWeb '07: Proceedings of the 3rd international workshop on
Adversarial information retrieval on the web, 2007, Pages: 29-36.
[Eintrag in der ACM Digital Library]
- Zoltán Gyöngyi, Hector Garcia-Molina:
Link spam alliances.
VLDB'2005:
Proceedings of the 31st international conference on
Very large data bases, Pages: 517-528, 2005.
[Alle Artikel der VLDB 2005 mit PDF]
- TrustRank
[vergeben]
- HITS
[vergeben]
- Jon M. Kleinberg:
Authoritative sources in a hyperlinked environment.
Journal of the ACM (JACM), Volume 46, Issue 5 (September 1999),
604 - 632
[Eintrag in der ACM Digital Library]
- Marc A. Najork, Hugo Zaragoza, Michael J. Taylor:
Hits on the web: how does it compare?
SIGIR '07: Proceedings of the 30th annual international ACM SIGIR
conference on Research and development in information retrieval,
2007,
471 - 478.
[Eintrag in der ACM Digital Library]
- Krishna Bharat, Monika R. Henzinger:
Improved algorithms for topic distillation
in a hyperlinked environment.
SIGIR '98: Proceedings of the 21st annual international ACM SIGIR
conference on Research and development in information retrieval,
1998,
104 - 111.
[Eintrag in der ACM Digital Library]
- Allan Borodin, Gareth O. Roberts, Jeffrey S. Rosenthal,
Panayiotis Tsaparas:
Finding authorities and hubs from link structures
on the World Wide Web.
Proceedings of the 10th international conference on World Wide Web,
415-429, May 01-05, 2001.
[Eintrag in der ACM Digital Library]
- Integritätsbedingungen in SQL
[vergeben]
- Ich gehe davon aus,
daß Sie die Vorlesung "Datenbanken I"
gehört haben.
- Die meisten Teilnehmer sollten aber noch
mindestens eine der Vorlesungen
"Datenbanken IIA: Datenbankentwurf",
"Datenbanken IIB: DBMS-Implementierung",
"Logische Programmierung und Deduktive Datenbanken"
gehört haben,
oder über entsprechende Kenntnisse verfügen.
Falls Sie keine dieser Vorlesungen gehört haben,
könnte der Einarbeitungsaufwand etwas größer werden.
- Kenntnis der englischen Sprache.
Die vorgegebenen Veröffentlichungen
werden voraussichtlich alle in Englisch abgefasst sein.
- Wichtig ist auch,
daß Sie genug Zeit mitbringen.
Die Vorbereitung eines Seminarvortrags kostet
mindestens drei Wochen Vollzeitarbeit,
eher mehr.
Die folgenden Informationen sind noch unverbindlich:
Ich muß mich erst nach der Prüfungsordnung
und dem sonst üblichen Vorgehen erkundigen.
- Sie müssen eine vorgegebene wissenschaftliche Veröffentlichung
zu Ihrem Seminarthema genau durcharbeiten.
- Sie müssen eine schriftliche Ausarbeitung
für Ihren Vortrag (ca. 8-10 Seiten)
rechtzeitig vor Ihrem Vortrag abgeben
(spätestens drei Wochen).
Dies soll keine deutsche Übersetzung des Artikels sein,
sondern schon von einer eigenen Durchdringung des Themas zeugen.
- Sie müssen einen guten Vortrag halten,
der sowohl vom Vortragsstil her akzeptabel ist,
als auch zeigt,
daß Sie den Gegenstand des Vortrags voll verstanden haben.
- Ihre Kenntnis des Gebiets sollen Sie auch in der Diskussion
unter Beweis stellen.
Wenn Sie bei vielen Fragen passen müssen,
ist es recht wahrscheinlich,
daß Sie durchfallen,
egal wie gut Ihr Vortrag sonst ist.
- Sie sollten Ihre Folien dem Dozenten spätestens eine Woche
vor dem Vortrag zeigen.
Das ist keine Bedingung,
aber Sie könnten eventuell noch nützliche Anregungen
bekommen.
- Es ist keine Bedingung,
daß Ausarbeitung und Vortrag alle Teile des Artikels
in allen Einzelheiten wiedergeben.
Das wäre von der Zeit her gar nicht möglich,
und es ist viel wichtiger,
daß die Zuhörer die Kerngedanken des Artikels verstehen,
als alle Varianten und Verfeinerungen abzuhandeln.
In der Diskussion müssten Sie aber ggf. auch wissen,
was sonst noch in dem Artikel steht.
Außerdem dürfen Sie keine zentralen Teile weglassen.
Wenn Sie die Ausarbeitung sehr rechtzeitig abgeben,
ist dies noch eine Gelegenheit,
die Stoffauswahl mit dem Dozenten abzuklären.
- Es ist gut, wenn Sie sich zusätzliche Literatur beschaffen;
häufig werde ich auch weitere Artikel nennen,
die zum Verstehen der Voraussetzungen
oder als Abrundung des Themas nützlich sind.
Die ganz zentralen Dinge des Hauptartikels müssen Sie aber
behandeln.
Die Überschrift Ihres Seminarthemas ist nicht so zu verstehen,
daß Sie einen ganz beliebigen Vortrag halten könnten,
der zu dieser Überschrift passt.
Sie können Ihren Hauptartikel nicht völlig ignorieren.
Ansonsten ist es natürlich gut,
wenn Sie in Ihrem Vortrag zur Abrundung auch Dinge behandeln,
die aus anderen Quellen stammen.
- Sie müssen an allen Vorträgen des Seminars teilnehmen.
Sie können einmal mit einer einfachen Entschuldigung fehlen.
Wenn Sie mehrmals fehlen, werden sehr gute Entschuldigungen nötig,
und Sie müssen sich selbst in die verpassten Themen einarbeiten,
so daß Sie einen kleinen mündlichen Test bestehen
können.
Falls das Seminar als Blockseminar stattfindet,
beziehen sich diese Regeln auf die einzelnen Vorträge.
Wenn Sie bei einem Blockseminar einen ganzen Tag fehlen würden,
hätten Sie ja schon einen großen Teil der Vorträge
verpasst:
Dann ist auf jeden Fall eine sehr gute Entschuldigung
plus Nacharbeit nötig.
Stefan Brass
(brass@acm.org),
26. Februar 2008
Original URL:
http://www.informatik.uni-halle.de/~brass/sem08/
[HTML 3.2 Checked]
[Links Geprüft]