Dies ist eine statische Kopie unseres alten Forums. Es sind keine Interaktionen möglich.
This is a static copy of our old forum. Interactions are not possible.

Ryoga`

Trainee

  • "Ryoga`" is male
  • "Ryoga`" started this thread

Posts: 51

Date of registration: Oct 15th 2008

Location: Sarstedt

1

Saturday, March 3rd 2012, 8:55pm

Technologien für das Internet I Fragen

Ich grüße euch,

Ich benötige Hilfe bei dem XML Aufgabenblatt 7, ich komme selbst mit den Vorlesungsfolien nicht zu der Beantwortung.
Unter Aufgabe 1 verstehe ich dass ich folgende Terme extrahiere:

film -> actor -> Robert Pattinson
film -> actor -> Kristen Stewart
actor -> Robert Pattinson
actor -> Kristen Stewart
Robert Pattinson
Kristen Stewart
film -> title -> eclipse
title -> eclipse
eclipse

Folglich wären das für mich 9 verschiedene strukturelle Termen. Ist das richtig?

Wäre auch euch super verbunden, wenn mir jemand Aufgabe 2 und 3 erklären könnte.
Danke im voraus!

FSW16

Trainee

  • "FSW16" is male

Posts: 119

Date of registration: Jun 25th 2008

Location: Hildesheim

2

Saturday, March 3rd 2012, 9:05pm

In der Übung wurde "Robert Pattinson" und "Kirsten Steward" in jeweils zwei Terme aufgeteilt und somit waren die Terme:

film -> actor -> Robert
film -> actor -> Pattinson
film -> actor -> Kristen
film -> actor -> Stewart
actor -> Robert
actor -> Pattinson
actor -> Kristen
actor -> Stewart
Robert
Pattinson
Kristen
Stewart
film -> title -> eclipse
title -> eclipse
eclipse


und somit 15Terme.

FSW16

Trainee

  • "FSW16" is male

Posts: 119

Date of registration: Jun 25th 2008

Location: Hildesheim

3

Saturday, March 3rd 2012, 9:08pm

Zu Aufgabe 2 habe ich leider nichts notiert und für Aufgabe 3 habe ich nur stehen:

score(Doc9,ST1)=CR(ST1,ST1)*weight(Doc9,ST1)+CR(ST1,ST5)*weight(Doc9,ST5)=0,578


weiss aber aucht nicht mehr ganz genau wie das zustande kam, ich wollte mir erst morgen alle Aufgaben nochmal angucken, aber vielleicht hilft es dir ja trotzdem.

MfG

  • "SIMPSON" is male

Posts: 88

Date of registration: Oct 15th 2010

Location: Hannover

4

Saturday, March 3rd 2012, 9:55pm

Aufgabe 1 von FSW16 ist richtig.


score(Doc9,ST1)=CR(ST1,ST1)*weight(Doc9,ST1)+CR(ST1,ST5)*weight(Doc9,ST5)=0,578

Wir wissen, dass CR(ST1,ST1) gleich 1 ist. Die anderen Werte lassen sich direkt aus der Aufgabenstellung ablesen:
weight(Doc9,ST1) = 0,2
CR(ST1,ST5) = 0,63
weight(Doc9,ST5) = 0,6

Für Aufgabe 2:

Source code

1
2
3
4
5
6
Ein gültiger XML-Baum für eine Beispielanfrage:
film -> actor -> Pattinson 

nicht gütlig:
film --> actor ----> Robert
                   \_-> Pattinson

Ich hoffe es ist erkennbar, das zwei Pfeile von actor ausgehen sollen.

FSW16

Trainee

  • "FSW16" is male

Posts: 119

Date of registration: Jun 25th 2008

Location: Hildesheim

5

Sunday, March 4th 2012, 4:19pm

Ich habe mal eine weitere Frage: Mal angenommen ich habe ein 4-gram Index und ich habe die Wildcard-Anfrage:
he*lo

Dann kann ich ja kein 4-gram aus der Anfrage herstellen, heißt es dann das diese Anfrage kein Ergebnis liefert?


Ich hoffe man versteht was ich meine.

MfG FSW


Edit: Zusätzliche Frage: War eigentlich irgendwer bei der Fragestunde am 27.02 und kann davon berichten. Wurde vielleicht noch irgenwas Wichtiges bzgl. der Klausur erwähnt?

This post has been edited 1 times, last edit by "FSW16" (Mar 4th 2012, 4:48pm)


Ryoga`

Trainee

  • "Ryoga`" is male
  • "Ryoga`" started this thread

Posts: 51

Date of registration: Oct 15th 2008

Location: Sarstedt

6

Sunday, March 4th 2012, 6:40pm

Ich danke euch beiden erstmals, habt mir sehr geholfen!
Zu der 4-gram Sache kann ich dir noch nicht helfen, da ich noch net dort bin.
Habe bei der Trigram Aufgabe zu S*warzneg*er erstmal nen Sprung über die Aufgabe gemacht.

Kann mir jemand zu Blatt 5 meine Lösung von dem Vector {0,5 ; 2 ; -1 ; 0,5 ; -0,5 ; -1 ; 0,5 ; -0,5 ; 2} bestätigen?
Heißt das die nächste Suchanfrage wäre "Ariolimax banana columbi mountains slug"?

Und eine kurze Frage zum erstellen von Inv. Indexes: Wenn im Text Zahlen vorkommen (nicht ausgeschrieben), zählen die mit zu den Satzzeichen/Stop-Wörtern?

danke im voraus again

  • "SIMPSON" is male

Posts: 88

Date of registration: Oct 15th 2010

Location: Hannover

7

Sunday, March 4th 2012, 6:48pm

Kann mir jemand zu Blatt 5 meine Lösung von dem Vector {0,5 ; 2 ; -1 ; 0,5 ; -0,5 ; -1 ; 0,5 ; -0,5 ; 2} bestätigen?
Heißt das die nächste Suchanfrage wäre "Ariolimax banana columbi mountains slug"?

Du darfst keine negativen Elemente in deinem Vector haben. Alle negativen Zahlen werden einfach zu 0.
{0,5 ; 2 ; 0 ; 0,5 ; 0 ; 0 ; 0,5 ; 0 ; 2} ist somit das richtige Ergebnis.


Und eine kurze Frage zum erstellen von Inv. Indexes: Wenn im Text Zahlen vorkommen (nicht ausgeschrieben), zählen die mit zu den Satzzeichen/Stop-Wörtern?

In den Folien steht, dass ältere IR-Systeme Zahlen nicht mit in den Index aufgenommen haben. Also werden neuere es wohl tun.
Aber die Stopwörte kriegen wir ja ohnehin gegeben, von daher würde ich Zahlen wie Wörter behandeln.

This post has been edited 1 times, last edit by "SIMPSON" (Mar 4th 2012, 7:01pm)


FSW16

Trainee

  • "FSW16" is male

Posts: 119

Date of registration: Jun 25th 2008

Location: Hildesheim

8

Sunday, March 4th 2012, 10:19pm

Ich würd gern nochmal auf mein Problem zu sprechen kommen, wenn es keinem etwas ausmacht. Mir ging es dabei hauptsächlich um die Aufgabe aus der Probeklausur bei der man eine Anfrage an einen Permuterm-Index und an einen Trigram-Index angeben soll, wenn die Suchanfrage S*warzeneg*er (Schwarzenegger) lautet.

Meine Überlegung war:
Permutermanfrage: S*er
Trigram-Anfrage: war AND arz AND rze AND zen AND ene AND neg AND er$



Würde mich über jede Hilfe, Anregung, etc. freuen

Shorty86

Trainee

  • "Shorty86" is male

Posts: 32

Date of registration: Oct 11th 2007

9

Sunday, March 4th 2012, 10:32pm

Hast eine Mail bekommen.

  • "SIMPSON" is male

Posts: 88

Date of registration: Oct 15th 2010

Location: Hannover

10

Sunday, March 4th 2012, 10:35pm


Meine Überlegung war:
Permutermanfrage: S*er
Trigram-Anfrage: war AND arz AND rze AND zen AND ene AND neg AND er$

Die Trigram-Anfrage habe ich genau so. Die Permutermanfrage müsste meiner Meinung nach aber "er$S*" sein.

Gruß

This post has been edited 1 times, last edit by "SIMPSON" (Mar 4th 2012, 11:46pm)


Ryoga`

Trainee

  • "Ryoga`" is male
  • "Ryoga`" started this thread

Posts: 51

Date of registration: Oct 15th 2008

Location: Sarstedt

11

Sunday, March 4th 2012, 11:24pm

Ich würd gern nochmal auf mein Problem zu sprechen kommen, wenn es keinem etwas ausmacht. Mir ging es dabei hauptsächlich um die Aufgabe aus der Probeklausur bei der man eine Anfrage an einen Permuterm-Index und an einen Trigram-Index angeben soll, wenn die Suchanfrage S*warzeneg*er (Schwarzenegger) lautet.

Meine Überlegung war:
Permutermanfrage: S*er
Trigram-Anfrage: war AND arz AND rze AND zen AND ene AND neg AND er$



Würde mich über jede Hilfe, Anregung, etc. freuen

wo bleibt bei der Trigramm Suchanfrage das S*? Ich frage, da ich das ende mit dem er$ nicht nachvollziehen kann.
Hätten wir Sx*warzneg*er gehabt, wäre dann auch ein $Sx vorn aufgetaucht?

und zum Permuterm, wieso wurde die Regel x*y -> y$x* verwendet? Ich würde da eher auf *x* -> x* tippen

This post has been edited 1 times, last edit by "Ryoga`" (Mar 4th 2012, 11:25pm)


FSW16

Trainee

  • "FSW16" is male

Posts: 119

Date of registration: Jun 25th 2008

Location: Hildesheim

12

Sunday, March 4th 2012, 11:37pm

Also das S* fällt meiner Meinung nach weg weil man daraus kein Trigram erstellen kann und bzgl. des Permuterms in der Übung haben wir auch die äußeren Terme verwendet.

Ryoga`

Trainee

  • "Ryoga`" is male
  • "Ryoga`" started this thread

Posts: 51

Date of registration: Oct 15th 2008

Location: Sarstedt

13

Sunday, March 4th 2012, 11:38pm

ok habe gerade erklärung gefunden
http://www.spinfo.phil-fak.uni-koeln.de/…r03_WS09-10.pdf

danke

Adro

Praktikant

Posts: 16

Date of registration: Feb 18th 2011

14

Monday, March 5th 2012, 12:13am

Hey,

ist vllt. bissl spät, aber stehe total aufm Schlauch gerade. Komme gerade bei der ersten Aufgabe auf den ersten Übungsblatt nicht weiter, ich glaube die Lösung war nicht so schwehr, habe mir leider nichts dazu aufgeschrieben.

Und falls einer von euch mir noch bei der Aufgabe 2 von der Übung vom 17.11.2011 helfen könnte. Muss ich bei der ersten Teilaufgabe (a) einfach die normalle Precision berechnen und dann den F1 (harmonic mean)? Wie löse ich am besten die die darauf folgenden Teilaufgaben.

Danke euch im voraus und viel erfolg später ;).

FSW16

Trainee

  • "FSW16" is male

Posts: 119

Date of registration: Jun 25th 2008

Location: Hildesheim

15

Monday, March 5th 2012, 1:05am

Erste Aufgabe auf dem ersten Übungsblatt habe ich folgendes notiert gehabt:

Sommer 20.0000 (2)
Sonne OR Gewitter 5000+1500=6500 (1)
NOT(Wind) 100.000-25.000=75.000 (3)

Und zwar wird mit der kleinsten Menge begonnen.


Und bei der Übung mit Precision (bei mir die Übung vom 24.11.11) musst du bei Aufgabe 2a) Die Precision von den Top20 berechen. Also P@20=6/20 (6 relevante Dokumente sind unter den Top20)
zu 2b) 25% Recall sind 2 Dokumente, also musst du die Precision von 2 relevanten Dokumenten ausrechnen und da die ersten beiden Dokumente relevante Dokumente sind erhälst du
P(25%Recall)=2/2=1

This post has been edited 2 times, last edit by "FSW16" (Mar 5th 2012, 1:06am)


Adro

Praktikant

Posts: 16

Date of registration: Feb 18th 2011

16

Monday, March 5th 2012, 1:37am

Vielen lieben Dank für deine Antwort. Hat mich echt weitergebracht, kannst mir vllt. noch sagen wie ich die 2c) löse.

Ryoga`

Trainee

  • "Ryoga`" is male
  • "Ryoga`" started this thread

Posts: 51

Date of registration: Oct 15th 2008

Location: Sarstedt

17

Monday, March 5th 2012, 8:37am

Falls du das noch lesen solltest. Da es kein Dokument gibt, welches uns genau 33% Recall gibt muss das ganze interpoliert werden.
Du schaust am besten zwischen welchen beiden Relavanten Dokumenten sich die 33% befinden, und ab diesen Dokumenten schaust
du auf die Precision Werte der "nächsten" Dokumente und pickst dir den max-Precission Wert einfach raus.
Bin grad aufgestanden, hoffe du kannst die Lösung irgendwie nachvollziehen ^^



Sprachenen>de YahooKE
earbeitung (wahlweise freigestellt)

This post has been edited 2 times, last edit by "Ryoga`" (Mar 5th 2012, 8:38am)


Shorty86

Trainee

  • "Shorty86" is male

Posts: 32

Date of registration: Oct 11th 2007

18

Thursday, March 15th 2012, 9:52am

Die Noten hängen aus. Falls jmd. hingeht und ein Foto macht, würde ich mich über dieses freuen.

Ryoga`

Trainee

  • "Ryoga`" is male
  • "Ryoga`" started this thread

Posts: 51

Date of registration: Oct 15th 2008

Location: Sarstedt

19

Thursday, March 15th 2012, 10:25am

Dito, komme vor dem 14.04 nicht mehr in die Uni :(

Adro

Praktikant

Posts: 16

Date of registration: Feb 18th 2011

20

Thursday, March 15th 2012, 11:06am

dito :D