Dies ist eine statische Kopie unseres alten Forums. Es sind keine Interaktionen möglich.
This is a static copy of our old forum. Interactions are not possible.

oixio

Senior Schreiberling

  • "oixio" is male
  • "oixio" started this thread

Posts: 517

Date of registration: Oct 3rd 2004

1

Monday, September 4th 2006, 11:01pm

Technologien für das Internet I

Hallo,

hat evtl schon mal einer "Technologien für das Internet I" mitgeschrieben und kann mal beschreiben, wie die Klausur aussieht? Bis jetzt weiß ich nähmlich nicht so wirklich, auf was ich mich vorbereiten muss. Gut ein PageRank berechnen wird wohl ziehmlich sicher dran kommen, aber was sonst? Eher die groben Zusammenhänge oder Detailfragen? Kann dazu jemand was sagen?

Achja falls das dafür interessant ist: Kohlschütter ist Übungbetreuer und Nejdl hält (ab und zu ;) ) die Vorlesung.
Dieser Post wurde aus 100 % chlorfrei gebleichten, handelsüblichen, freilaufenden, glücklichen Elektronen erzeugt!

SUPERDIM

Junior Schreiberling

  • "SUPERDIM" is male

Posts: 171

Date of registration: Oct 7th 2004

Location: Hannover

Occupation: 1. Semester M.Sc. Informatik

2

Tuesday, September 5th 2006, 1:15am

Wäre interessant zu wissen, ob vom Dozenten etwas spezielles zu der Klausur gesagt wurde.

Ansonsten gibt es hier eine alte Klausur: http://www.kbs.uni-hannover.de/Lehre/TI1…2004/index.html

Wenn ich vom Material ausgehe, wird der Themenschwerpunkt aber ziemlich woanders liegen. Ich arbeite mich einfach durch das Material. Die Folien von Jamie Callen sind ziemlich gut. :)

Torrero

Senior Schreiberling

  • "Torrero" is male

Posts: 854

Date of registration: Oct 16th 2003

Location: Laatzen

Occupation: Angewandte Informatik

3

Wednesday, September 6th 2006, 11:21am

Vor einem Jahr waren es eher grobe und kurze Theorie-Sachen, die abgefragt wurden + PageRank, was glaub ich knapp 1/4 der Punkte ausmachte + RDF, was aber dieses mal glaub ich nicht dran war, oder doch ? Die letzten 3 Termine hab ich nämlich nicht wirklich wahrgenommen.

serotonin

Trainee

Posts: 96

Date of registration: Oct 24th 2003

Occupation: was wohl?

4

Wednesday, September 6th 2006, 1:27pm

RDF hab ich bisher noch nicht in den Folien gefunden, aber das Skript dreht sich eigentlich auch nur um Suchmaschinen und deren Verfahren.

War zufällig jemand bei den Übungen, wo Lucene besprochen wurde und kann einen kurzen Überblick geben, was gemacht wurde? Danke =)
"Data items tend to be like children; they enjoy hanging around in groups together."

oixio

Senior Schreiberling

  • "oixio" is male
  • "oixio" started this thread

Posts: 517

Date of registration: Oct 3rd 2004

5

Wednesday, September 6th 2006, 1:36pm

Quoted

Original von serotonin
War zufällig jemand bei den Übungen, wo Lucene besprochen wurde und kann einen kurzen Überblick geben, was gemacht wurde? Danke =)


Naja - so richtig viel eigentlich nicht. Er hat grob anhand eines Quelltextes erklärt, wie man Lucene einsetzt (also wie man Dokumente anlegt, in den Index einliest und drin sucht). Dann hat Kohlschütter noch einige seiner eigenen Projekte vorgestellt (einige davon mit Lucene) und hat dabei ab und zu erzählt wo die Probleme lagen und grob wie er das Problem gelöst hat. Aber es war jetzt nichts dabei wo ich aus dem Gedächnis sagen würde: "Hey, das kommt bestimmt in der Klausur dran".

Hat jemand was anderes in erinnerung, dann korrigiert mich bitte
Dieser Post wurde aus 100 % chlorfrei gebleichten, handelsüblichen, freilaufenden, glücklichen Elektronen erzeugt!

Teklan

Erfahrener Schreiberling

Posts: 267

Date of registration: Nov 13th 2004

Location: Hannover

6

Wednesday, September 6th 2006, 10:52pm

Irgendwie schnall ich das mit dem Pagerank noch nicht.

Gibt es etwa mindestens zwei Verfahren, die "Pagerank" in ihren Namen haben oder warum haben wir z.B. in der einzigen echten Übung eine Formel verwendet, die nicht so aussah wie die folgende

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

Obige Formel treffe ich überall im Net an.

Die von uns verwendete sah aber doch so aus:

PR_n+1(X) = (1-c) * A * PR_n(X) + c * Einheitsvektor

This post has been edited 1 times, last edit by "Teklan" (Sep 6th 2006, 10:52pm)


  • "Joachim" is male

Posts: 2,863

Date of registration: Dec 11th 2001

Location: Hämelerwald

Occupation: Wissenschaftlicher Mitarbeiter (Forschungszentrum L3S, TU Braunschweig)

7

Thursday, September 7th 2006, 9:08am

Quoted

Original von Teklan
Gibt es etwa mindestens zwei Verfahren, die "Pagerank" in ihren Namen haben oder warum haben wir z.B. in der einzigen echten Übung eine Formel verwendet, die nicht so aussah wie die folgende

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

Obige Formel treffe ich überall im Net an.

Die von uns verwendete sah aber doch so aus:

PR_n+1(X) = (1-c) * A * PR_n(X) + c * Einheitsvektor
Es fällt auf, daß der Ausdruck "PR" in der oberen Formel keinen Index hat, in der unteren jedoch schon. Es handelt sich hierbei also in der Tat um zwei verschiedene Dinge.

Die obere Gleichung bezieht sich auf den Gleichgewichtspunkt des zum PageRank-Modell gehörigen Markovkette. Die untere beschreibt ein numerisches Verfahren zur iterativen Berechnung des PageRank.

Mir scheint, daß Du Dir bisher nur diese Formeln angeschaut hast, aber noch nicht, wo diese denn herkommen, also welches Modell dem PageRank zugrunde liegt. Um die obigen Formeln zu verstehen, halte ich es für sinnvoll, dieses nachzuholen. Die Stichworte "random surfer", "Markov chain" und "steady state" sollten bei der Suche hilfreich sein.

Im Grunde läuft die Berechnung des PageRank auf die Lösung eines linearen Gleichungssystems heraus. Das obige iterative Verfahren funktioniert zwar auch, bringt aber nur bei wirklich großen Netzwerken echte Vorteile. Für die Klausur ist daher vermutlich die exakte Bestimmung des PageRanks über das lineare Gleichungssystem sinnvoll.

Falls Du dazu noch Fragen haben solltest, helfe ich natürlich gerne weiter. :)
The purpose of computing is insight, not numbers.
Richard Hamming, 1962

oixio

Senior Schreiberling

  • "oixio" is male
  • "oixio" started this thread

Posts: 517

Date of registration: Oct 3rd 2004

8

Thursday, September 7th 2006, 11:40am

Quoted

Original von Joachim
Für die Klausur ist daher vermutlich die exakte Bestimmung des PageRanks über das lineare Gleichungssystem sinnvoll.


Naja - in der Übung haben wir nur das iterative Verfahren gemacht, und so, denke ich, wird auch nur dieses dran kommen. Zu dem anderen müssen wir dann höchstens die Theorie kennen.

Korrigiert mich, wenn ich falsch liege.
Dieser Post wurde aus 100 % chlorfrei gebleichten, handelsüblichen, freilaufenden, glücklichen Elektronen erzeugt!

  • "Joachim" is male

Posts: 2,863

Date of registration: Dec 11th 2001

Location: Hämelerwald

Occupation: Wissenschaftlicher Mitarbeiter (Forschungszentrum L3S, TU Braunschweig)

9

Thursday, September 7th 2006, 11:43am

Quoted

Original von oixio

Quoted

Original von Joachim
Für die Klausur ist daher vermutlich die exakte Bestimmung des PageRanks über das lineare Gleichungssystem sinnvoll.


Naja - in der Übung haben wir nur das iterative Verfahren gemacht, und so, denke ich, wird auch nur dieses dran kommen. Zu dem anderen müssen wir dann höchstens die Theorie kennen.

Korrigiert mich, wenn ich falsch liege.
Das kommt auf die Fragestellung in der Klausur an. :) Wenn dort nur nach dem PageRank in einem speziellen Fall gefragt ist, halte ich das exakte Verfahren für einfacher und schneller. Wenn die Aufgabe die Anwendung des iterativen approximativen Verfahrens fordert, hat man natürlich nicht mehr die Wahl.

Es fördert aber sicherlich das Verständnis, beide Verfahren zu beherrschen. :)
The purpose of computing is insight, not numbers.
Richard Hamming, 1962

Teklan

Erfahrener Schreiberling

Posts: 267

Date of registration: Nov 13th 2004

Location: Hannover

10

Friday, September 8th 2006, 4:22pm

Danke nochmal an Joachim. Das mit den Markov-Ketten war mir beim ersten Lesen noch irgendwie zu hoch - sie dienen wahrscheinlich nicht zur besseren Veranschaulichung des Pagerank-Algorithmus^^