Du bist nicht angemeldet.

Ryoga`

Trainee

  • »Ryoga`« ist männlich
  • »Ryoga`« ist der Autor dieses Themas

Beiträge: 51

Registrierungsdatum: 15.10.2008

Wohnort: Sarstedt

1

03.03.2012, 20:55

Technologien für das Internet I Fragen

Ich grüße euch,

Ich benötige Hilfe bei dem XML Aufgabenblatt 7, ich komme selbst mit den Vorlesungsfolien nicht zu der Beantwortung.
Unter Aufgabe 1 verstehe ich dass ich folgende Terme extrahiere:

film -> actor -> Robert Pattinson
film -> actor -> Kristen Stewart
actor -> Robert Pattinson
actor -> Kristen Stewart
Robert Pattinson
Kristen Stewart
film -> title -> eclipse
title -> eclipse
eclipse

Folglich wären das für mich 9 verschiedene strukturelle Termen. Ist das richtig?

Wäre auch euch super verbunden, wenn mir jemand Aufgabe 2 und 3 erklären könnte.
Danke im voraus!

FSW16

Trainee

  • »FSW16« ist männlich

Beiträge: 119

Registrierungsdatum: 25.06.2008

Wohnort: Hildesheim

2

03.03.2012, 21:05

In der Übung wurde "Robert Pattinson" und "Kirsten Steward" in jeweils zwei Terme aufgeteilt und somit waren die Terme:

film -> actor -> Robert
film -> actor -> Pattinson
film -> actor -> Kristen
film -> actor -> Stewart
actor -> Robert
actor -> Pattinson
actor -> Kristen
actor -> Stewart
Robert
Pattinson
Kristen
Stewart
film -> title -> eclipse
title -> eclipse
eclipse


und somit 15Terme.

FSW16

Trainee

  • »FSW16« ist männlich

Beiträge: 119

Registrierungsdatum: 25.06.2008

Wohnort: Hildesheim

3

03.03.2012, 21:08

Zu Aufgabe 2 habe ich leider nichts notiert und für Aufgabe 3 habe ich nur stehen:

score(Doc9,ST1)=CR(ST1,ST1)*weight(Doc9,ST1)+CR(ST1,ST5)*weight(Doc9,ST5)=0,578


weiss aber aucht nicht mehr ganz genau wie das zustande kam, ich wollte mir erst morgen alle Aufgaben nochmal angucken, aber vielleicht hilft es dir ja trotzdem.

MfG

  • »SIMPSON« ist männlich

Beiträge: 88

Registrierungsdatum: 15.10.2010

Wohnort: Hannover

4

03.03.2012, 21:55

Aufgabe 1 von FSW16 ist richtig.


score(Doc9,ST1)=CR(ST1,ST1)*weight(Doc9,ST1)+CR(ST1,ST5)*weight(Doc9,ST5)=0,578

Wir wissen, dass CR(ST1,ST1) gleich 1 ist. Die anderen Werte lassen sich direkt aus der Aufgabenstellung ablesen:
weight(Doc9,ST1) = 0,2
CR(ST1,ST5) = 0,63
weight(Doc9,ST5) = 0,6

Für Aufgabe 2:

Quellcode

1
2
3
4
5
6
Ein gültiger XML-Baum für eine Beispielanfrage:
film -> actor -> Pattinson 

nicht gütlig:
film --> actor ----> Robert
                   \_-> Pattinson

Ich hoffe es ist erkennbar, das zwei Pfeile von actor ausgehen sollen.

FSW16

Trainee

  • »FSW16« ist männlich

Beiträge: 119

Registrierungsdatum: 25.06.2008

Wohnort: Hildesheim

5

04.03.2012, 16:19

Ich habe mal eine weitere Frage: Mal angenommen ich habe ein 4-gram Index und ich habe die Wildcard-Anfrage:
he*lo

Dann kann ich ja kein 4-gram aus der Anfrage herstellen, heißt es dann das diese Anfrage kein Ergebnis liefert?


Ich hoffe man versteht was ich meine.

MfG FSW


Edit: Zusätzliche Frage: War eigentlich irgendwer bei der Fragestunde am 27.02 und kann davon berichten. Wurde vielleicht noch irgenwas Wichtiges bzgl. der Klausur erwähnt?

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »FSW16« (04.03.2012, 16:48)


Ryoga`

Trainee

  • »Ryoga`« ist männlich
  • »Ryoga`« ist der Autor dieses Themas

Beiträge: 51

Registrierungsdatum: 15.10.2008

Wohnort: Sarstedt

6

04.03.2012, 18:40

Ich danke euch beiden erstmals, habt mir sehr geholfen!
Zu der 4-gram Sache kann ich dir noch nicht helfen, da ich noch net dort bin.
Habe bei der Trigram Aufgabe zu S*warzneg*er erstmal nen Sprung über die Aufgabe gemacht.

Kann mir jemand zu Blatt 5 meine Lösung von dem Vector {0,5 ; 2 ; -1 ; 0,5 ; -0,5 ; -1 ; 0,5 ; -0,5 ; 2} bestätigen?
Heißt das die nächste Suchanfrage wäre "Ariolimax banana columbi mountains slug"?

Und eine kurze Frage zum erstellen von Inv. Indexes: Wenn im Text Zahlen vorkommen (nicht ausgeschrieben), zählen die mit zu den Satzzeichen/Stop-Wörtern?

danke im voraus again

  • »SIMPSON« ist männlich

Beiträge: 88

Registrierungsdatum: 15.10.2010

Wohnort: Hannover

7

04.03.2012, 18:48

Kann mir jemand zu Blatt 5 meine Lösung von dem Vector {0,5 ; 2 ; -1 ; 0,5 ; -0,5 ; -1 ; 0,5 ; -0,5 ; 2} bestätigen?
Heißt das die nächste Suchanfrage wäre "Ariolimax banana columbi mountains slug"?

Du darfst keine negativen Elemente in deinem Vector haben. Alle negativen Zahlen werden einfach zu 0.
{0,5 ; 2 ; 0 ; 0,5 ; 0 ; 0 ; 0,5 ; 0 ; 2} ist somit das richtige Ergebnis.


Und eine kurze Frage zum erstellen von Inv. Indexes: Wenn im Text Zahlen vorkommen (nicht ausgeschrieben), zählen die mit zu den Satzzeichen/Stop-Wörtern?

In den Folien steht, dass ältere IR-Systeme Zahlen nicht mit in den Index aufgenommen haben. Also werden neuere es wohl tun.
Aber die Stopwörte kriegen wir ja ohnehin gegeben, von daher würde ich Zahlen wie Wörter behandeln.

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »SIMPSON« (04.03.2012, 19:01)


FSW16

Trainee

  • »FSW16« ist männlich

Beiträge: 119

Registrierungsdatum: 25.06.2008

Wohnort: Hildesheim

8

04.03.2012, 22:19

Ich würd gern nochmal auf mein Problem zu sprechen kommen, wenn es keinem etwas ausmacht. Mir ging es dabei hauptsächlich um die Aufgabe aus der Probeklausur bei der man eine Anfrage an einen Permuterm-Index und an einen Trigram-Index angeben soll, wenn die Suchanfrage S*warzeneg*er (Schwarzenegger) lautet.

Meine Überlegung war:
Permutermanfrage: S*er
Trigram-Anfrage: war AND arz AND rze AND zen AND ene AND neg AND er$



Würde mich über jede Hilfe, Anregung, etc. freuen

Shorty86

Trainee

  • »Shorty86« ist männlich

Beiträge: 32

Registrierungsdatum: 11.10.2007

9

04.03.2012, 22:32

Hast eine Mail bekommen.

  • »SIMPSON« ist männlich

Beiträge: 88

Registrierungsdatum: 15.10.2010

Wohnort: Hannover

10

04.03.2012, 22:35


Meine Überlegung war:
Permutermanfrage: S*er
Trigram-Anfrage: war AND arz AND rze AND zen AND ene AND neg AND er$

Die Trigram-Anfrage habe ich genau so. Die Permutermanfrage müsste meiner Meinung nach aber "er$S*" sein.

Gruß

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »SIMPSON« (04.03.2012, 23:46)


Ryoga`

Trainee

  • »Ryoga`« ist männlich
  • »Ryoga`« ist der Autor dieses Themas

Beiträge: 51

Registrierungsdatum: 15.10.2008

Wohnort: Sarstedt

11

04.03.2012, 23:24

Ich würd gern nochmal auf mein Problem zu sprechen kommen, wenn es keinem etwas ausmacht. Mir ging es dabei hauptsächlich um die Aufgabe aus der Probeklausur bei der man eine Anfrage an einen Permuterm-Index und an einen Trigram-Index angeben soll, wenn die Suchanfrage S*warzeneg*er (Schwarzenegger) lautet.

Meine Überlegung war:
Permutermanfrage: S*er
Trigram-Anfrage: war AND arz AND rze AND zen AND ene AND neg AND er$



Würde mich über jede Hilfe, Anregung, etc. freuen

wo bleibt bei der Trigramm Suchanfrage das S*? Ich frage, da ich das ende mit dem er$ nicht nachvollziehen kann.
Hätten wir Sx*warzneg*er gehabt, wäre dann auch ein $Sx vorn aufgetaucht?

und zum Permuterm, wieso wurde die Regel x*y -> y$x* verwendet? Ich würde da eher auf *x* -> x* tippen

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »Ryoga`« (04.03.2012, 23:25)


FSW16

Trainee

  • »FSW16« ist männlich

Beiträge: 119

Registrierungsdatum: 25.06.2008

Wohnort: Hildesheim

12

04.03.2012, 23:37

Also das S* fällt meiner Meinung nach weg weil man daraus kein Trigram erstellen kann und bzgl. des Permuterms in der Übung haben wir auch die äußeren Terme verwendet.

Ryoga`

Trainee

  • »Ryoga`« ist männlich
  • »Ryoga`« ist der Autor dieses Themas

Beiträge: 51

Registrierungsdatum: 15.10.2008

Wohnort: Sarstedt

13

04.03.2012, 23:38

ok habe gerade erklärung gefunden
http://www.spinfo.phil-fak.uni-koeln.de/…r03_WS09-10.pdf

danke

Adro

Praktikant

Beiträge: 16

Registrierungsdatum: 18.02.2011

14

05.03.2012, 00:13

Hey,

ist vllt. bissl spät, aber stehe total aufm Schlauch gerade. Komme gerade bei der ersten Aufgabe auf den ersten Übungsblatt nicht weiter, ich glaube die Lösung war nicht so schwehr, habe mir leider nichts dazu aufgeschrieben.

Und falls einer von euch mir noch bei der Aufgabe 2 von der Übung vom 17.11.2011 helfen könnte. Muss ich bei der ersten Teilaufgabe (a) einfach die normalle Precision berechnen und dann den F1 (harmonic mean)? Wie löse ich am besten die die darauf folgenden Teilaufgaben.

Danke euch im voraus und viel erfolg später ;).

FSW16

Trainee

  • »FSW16« ist männlich

Beiträge: 119

Registrierungsdatum: 25.06.2008

Wohnort: Hildesheim

15

05.03.2012, 01:05

Erste Aufgabe auf dem ersten Übungsblatt habe ich folgendes notiert gehabt:

Sommer 20.0000 (2)
Sonne OR Gewitter 5000+1500=6500 (1)
NOT(Wind) 100.000-25.000=75.000 (3)

Und zwar wird mit der kleinsten Menge begonnen.


Und bei der Übung mit Precision (bei mir die Übung vom 24.11.11) musst du bei Aufgabe 2a) Die Precision von den Top20 berechen. Also P@20=6/20 (6 relevante Dokumente sind unter den Top20)
zu 2b) 25% Recall sind 2 Dokumente, also musst du die Precision von 2 relevanten Dokumenten ausrechnen und da die ersten beiden Dokumente relevante Dokumente sind erhälst du
P(25%Recall)=2/2=1

Dieser Beitrag wurde bereits 2 mal editiert, zuletzt von »FSW16« (05.03.2012, 01:06)


Adro

Praktikant

Beiträge: 16

Registrierungsdatum: 18.02.2011

16

05.03.2012, 01:37

Vielen lieben Dank für deine Antwort. Hat mich echt weitergebracht, kannst mir vllt. noch sagen wie ich die 2c) löse.

Ryoga`

Trainee

  • »Ryoga`« ist männlich
  • »Ryoga`« ist der Autor dieses Themas

Beiträge: 51

Registrierungsdatum: 15.10.2008

Wohnort: Sarstedt

17

05.03.2012, 08:37

Falls du das noch lesen solltest. Da es kein Dokument gibt, welches uns genau 33% Recall gibt muss das ganze interpoliert werden.
Du schaust am besten zwischen welchen beiden Relavanten Dokumenten sich die 33% befinden, und ab diesen Dokumenten schaust
du auf die Precision Werte der "nächsten" Dokumente und pickst dir den max-Precission Wert einfach raus.
Bin grad aufgestanden, hoffe du kannst die Lösung irgendwie nachvollziehen ^^



Sprachenen>de YahooKE
earbeitung (wahlweise freigestellt)

Dieser Beitrag wurde bereits 2 mal editiert, zuletzt von »Ryoga`« (05.03.2012, 08:38)


Shorty86

Trainee

  • »Shorty86« ist männlich

Beiträge: 32

Registrierungsdatum: 11.10.2007

18

15.03.2012, 09:52

Die Noten hängen aus. Falls jmd. hingeht und ein Foto macht, würde ich mich über dieses freuen.

Ryoga`

Trainee

  • »Ryoga`« ist männlich
  • »Ryoga`« ist der Autor dieses Themas

Beiträge: 51

Registrierungsdatum: 15.10.2008

Wohnort: Sarstedt

19

15.03.2012, 10:25

Dito, komme vor dem 14.04 nicht mehr in die Uni :(

Adro

Praktikant

Beiträge: 16

Registrierungsdatum: 18.02.2011

20

15.03.2012, 11:06

dito :D