| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • You already know Dokkio is an AI-powered assistant to organize & manage your digital files & messages. Very soon, Dokkio will support Outlook as well as One Drive. Check it out today!

View
 

semant

Page history last edited by Eric Sieverts 8 years, 1 month ago

Opdrachten bij de GO-cursus "Semantisch zoeken" - maart 2016

>> [Presentatie waar deze opdrachten bijhoren]

Verdere interessante links volgen onder de opdrachten

 

 

1. Feitelijke antwoorden.

Sommigen maken zich zorgen over de toegepaste selectie voor de antwoorden die in systemen als Google's Knowledge Graph of Bing's Satori worden gepresenteerd als "de waarheid". 

Anderen vrezen dat gebruikers helemaal niet meer aan uitgebreider beschrijvingen in de Wikipedia of (andere) gewone zoekrsultaten toekomen.

 

Onderzoek dit voor een aantal zoekvragen door voor een aantal systemen na te gaan op welke vragen u wat voor soort antwoord krijgt (concreet antwoord / antwoord verborgen in meer tekst over het onderwerp / geen of onjuist antwoord / alleen gewoon zoekmachine-antwoord). Probeer daarbij ook de formulering van uw vraag eventueel te variëren.

Maak hierbij een vergelijking tussen:

  • het antwoord uit Google's Knowledge Graph  [NB: gebruik hiervoor de  .com  versie met Engelstalig interface]
  • het antwoord uit Bing's Entity Engine (Satori)  [NB: zet hiervoor de landeninstelling op VS - onder {instellingen} - {regio}]
  • het antwoord uit de Wolfram|Alpha knowledge engine (http://www.wolframalpha.com/)
  • het antwoord dat DuckDuckGo geeft 
  • de gegevens over dat onderwerp uit de Wikipedia
  • wat het gewone zoekresultaat uit Google als eerste "antwoorden" biedt 

 

Bedenk hiertoe zelf een aantal vragen of probeer enkele van de onderstaande of variaties daarop: 

 

gewoon als onderwerp omschreven  als vraag omschreven 
  • birth date beethoven
  • melting point of iron
  • population of Sao Paulo
  • apples vs pears
  • flag of Ecuador
  • vlag van Ecuador
  • safety measures in long traffic tunnels 
  • soccer
  • nobel prize physics
  • design of euro bank notes  
  • how many calories in french fries
  • who won the 1992 nobel peace prize
  • what country won most nobel prizes 
  • what is melting point of iron 
  • how many plays wrote Shakespeare 
  • how many people live in paris  

 

 

2. Herkennen van betekenis - entiteiten

 

2.a Gebruik van "OpenCalais"

  • Ga naar de website van de Open Calais service:  http://www.opencalais.com/opencalais-demo/
  • Open een ander browservenster en zoek daar een Engelstalige tekst, bijvoorbeeld een krantenartikel (NY Times, Guardian, ....) of een persbericht.
  • Knip de tekst en plak hem in het tekst-venster van Open Calais.
  • Klik op [TAG IT] en kijk welke (soorten) entiteiten in de tekst zijn herkend (en gemarkeerd).
  • In de linker kolom kunt u de verschillende soorten entiteiten ook openklikken om ze allemaal opgesomd te krijgen. U ziet daar ook welke onderwerpen aan de tekst zijn toegekend.
  • Herhaal dit desgewenst nog met een andere tekst.

 

2.b Gebruik van "Zemanta"

- Ga naar de demo-site van Zemanta:  http://www.zemanta.com/demo/

- Plak hier dezelfde artikelen/teksten in, als u bij de vorige opdracht gebruikte (in plaats van de al in het venster aanwezige tekst) en klik op "Run Demo". 

- Kijk in hoeverre hier andere dingen gebeuren. Bekijk daarbij vooral de hyperlinks en tags onderaan de tekst.

- NB: Jammer genoeg kun je de hiervoor toegevoegde codering niet te zien krijgen.

 

2.c Gebruik van S4 Ontotext

- Ga naar de site van S4 Ontotext: https://console.s4.ontotext.com/

- Klik op “Try it now”

- Plak een stuk Engelstalige tekst naar keuze (nieuwsbericht / medisch / tweet) in het daarvoor bestemde venster.

- Selecteer, afhankelijk van de aard van de tekst (nieuws – biomedisch – tweet) een dienst en klik op “Execute”.

- Kijk zeker ook een keer wat de “News Classifier” doet.

 

3. Herkennen van betekenis - sentiment detection

Probeer enkele van deze systemen met uw eigen tekst of zoekwoorden

          Analyse van willekeurige stukken in te plakken Engelse, Nederlandse of Franse tekst.

           Nieuwsanalyse 

          Sociale media metasearch; toont in linker kolom o.a. sentiment analyse

 

 

4. Herkennen van betekenis - onderwerpsclassificatie

  • Ga naar de website van ACT-DL:  http://act-dl.base-search.net/ 
  • U kunt daar teksten laten categoriseren op basis van de Dewey Decimale Classificatie 
  • Kies één van de opties om hetzij een ergens "uitgeknipt" stuk tekst (via "text categorizer"), hetzij een webpagina (URL via "web categorizer"), hetzij een PDF-document (upload via "PDF categorizer") te laten voorzien van een Dewey-code.

 

 

5. Gestructureerd zoeken met Facebook Graph Search

     (Alleen als u een Facebook account hebt)

     [NB: mogelijkheden zijn onlangs sterk beperkt]

  • Verander de taalinstelling van Facebook (onder het tandwieltje - Account Settings) in "English (US)".
  • Als je zelf een gestructureerde vraag begint in te tikken, kun je je soms laten inspireren door de suggesties in het uitklapmenu

          Raadpleeg desgewenst de "Giant List of Facebook Graph Search Queries"

          http://wrightimc.com/blog/2013/08/12/the-giant-list-of-facebook-graph-search-queries/

          of de "Facebook Graph Manual: 97 pages manual with clever search phrases" (Slideshare) van Henk van Ess

          http://www.slideshare.net/searchbistro/facebook-graph-manual-clever-search-phrases-for-reporters

  • Kun je vinden welke films mooi gevonden worden door KNVI-leden die met de bibliotheektour naar Schotland zijn meegeweest?
  • Favoriete boeken van mensen die bij Microsoft werken?

 

 

6. Embedded metadata, microdata

  • Installeer hiervoor Extensies voor Google Chrome. Ga daartoe naar  http://chrome.google.com/webstore/category/extensions
  • Tik als zoekterm in: "microdata" en kies vervolgens in de linker kolom dat u alleen "Extensions" wilt zien.
  • Installeer achtereenvolgens "Microdata.reveal" en "Semantic Inspector" door op de blauwe knop met de  +  te  klikken.
  • Installeer eventueel ook nog "META SEO Inspector" die u kunt vinden door op dezelfde manier naar "rdfa" te zoeken.
  • Open webpagina's op diverse sites en kijk of iconen van de hulpprogramma's in de adresbalk van uw browser verschijnen ten teken dat er gestandaardiseerde metadata aanwezig zijn. Klik dan op die iconen om te zien welke dat zijn (en volgens welke standaarden). [De icoon van META SEO Inspector is altijd zichtbaar - naast de adresbalk].
  • U kunt dit bijvoorbeeld proberen
    • op websites met recepten,
    • op sites van kranten (ook buitenlandse),
    • op Last.fm (muziek of artiesten),
    • in de IMDb (Internet Movie Database - films),
    • op de boekensite Goodreads.com
    • of op grote (Amerikaanse) e-commerce sites als van BestBuy, Walmart of Sears.

 

     Als u geen Chrome-extensies wilt/kunt installeren, kun u ook URL's invoeren in:

 

 

7. Hulpmiddelen voor RDF en Linked Data

 

7.a

Analyseer een paar van de bij opdracht 6 bekeken webpagina's op de aanwezigheid van RDF codering met behulp van de Graphite RDF browser: http://graphite.ecs.soton.ac.uk/browser/

In plaats van zelf een URL (URI) in te voeren, kunt u ook een van de op de pagina vermelde links uitproberen.

 

7.b 

Probeer een paar van de voorgeprogrammeerde SPARQL Linked Data queries op http://client.linkeddatafragments.org/

In het bovenste vakje kunt u daarbij kiezen in welke van de genoemde databronnen (Endpoints) u gezocht wilt hebben.

In het tweede vakje kunt u een vraag selecteren.

Door op [Execute Query] te klikken, wordt de zoekactie uitgevoerd.

 

 

 

8. Automatische bewerking van zoekresultaat en andere semantische zoekmachines

     Vergelijk wat er met uw zoekvraag gebeurt bij

     en vergelijk dit ook weer met de eerste antwoorden van een gewone Google zoekactie.

     Bedenk hiervoor zelf een paar zoekvragen of gebruik enkele van de bij opdracht 1 vermelde testvragen.

 

 

 

 

Verdere interessante links bij Semantisch zoeken

 

 

 

 

 

 

 

 

  

 

 

 

 

 

 

 

 

 

 

 

  

 

 

 

Comments (0)

You don't have permission to comment on this page.