Sie sind nicht angemeldet.

Bishara

Trainee

  • »Bishara« ist männlich
  • »Bishara« ist der Autor dieses Themas

Beiträge: 33

Registrierungsdatum: 05.11.2006

1

07.11.2006, 20:38

Information Retrieval Frage

Aufgabe 4 kann jemand mir hilfen?

das Link für die Aufgabe
http://www.l3s.uni-hannover.de/~selke/te…mmdb1-ws0607-u2

Grüße
Bishara

  • »Joachim« ist männlich

Beiträge: 2 863

Registrierungsdatum: 11.12.2001

Wohnort: Hämelerwald

Beruf: Wissenschaftlicher Mitarbeiter (Forschungszentrum L3S, TU Braunschweig)

2

08.11.2006, 07:06

RE: Information Retrieval Frage

Zitat

Original von Bishara
Aufgabe 4 kann jemand mir hilfen?
Klar. Gerne sogar. Du mußt dann allerdings schon sagen, was genau Dir bei dieser Aufgabe Schwierigkeiten bereitet ...
The purpose of computing is insight, not numbers.
Richard Hamming, 1962

yv

Junior Schreiberling

  • »yv« ist weiblich

Beiträge: 229

Registrierungsdatum: 11.12.2001

3

08.11.2006, 12:40

Ich hätte da auch mal eine Frage zu:
Woher kommen in Vorlesung 2, Folie 25 die Kommazahlen? Vermute ich richtig, dass die einfach als Beispiel gegeben sind?
Wenn ich Aufgabe 4 richtig gelöst habe, gibt es ja bis zum Skalarprodukt nur ganze Zahlen und erst bei den Ähnichkeitsmaßen kommen Wurzeln ins Spiel, oder?

  • »Joachim« ist männlich

Beiträge: 2 863

Registrierungsdatum: 11.12.2001

Wohnort: Hämelerwald

Beruf: Wissenschaftlicher Mitarbeiter (Forschungszentrum L3S, TU Braunschweig)

4

08.11.2006, 14:35

Zitat

Original von yv
Ich hätte da auch mal eine Frage zu:
Woher kommen in Vorlesung 2, Folie 25 die Kommazahlen? Vermute ich richtig, dass die einfach als Beispiel gegeben sind?
Ja, das ist nur ein Beispiel. Die Repräsentationen der Dokumente beruhen also nicht auf TFxIDF oder sowas. Die Repräsentation der Anfrage ergibt sich allerdings aus der über der Tabelle stehenden Anfrageformulierung (aber nicht exakt, man könnte auch eine andere Repräsentation wählen; es sollte lediglich der Buch-Wert der größte und der Skript-Wert der kleinste sein).

Zitat

Wenn ich Aufgabe 4 richtig gelöst habe, gibt es ja bis zum Skalarprodukt nur ganze Zahlen und erst bei den Ähnichkeitsmaßen kommen Wurzeln ins Spiel, oder?
Nur bei der vektoriellen Repräsentation werden die Dokumente jeweils durch einen 0/1-Vektor repräsentiert. Verwendet man TFxIDF ergeben sich Brüche (Dokument 1 wird dann beispielsweise durch (0, 1, 1/2, 1/2, 0) repräsentiert).
The purpose of computing is insight, not numbers.
Richard Hamming, 1962

yv

Junior Schreiberling

  • »yv« ist weiblich

Beiträge: 229

Registrierungsdatum: 11.12.2001

5

08.11.2006, 17:10

Oh, ja,. stimmt, das mit 1/2 hatte ich übersehen. Jetzt passen die Zahlen auch besser. :)
Vielen Dank!