Corso di information retrieval

Nei giorni in cui vi prende l'ispirazione hi-tech...prendete in mano la tastiera e sfogatevi qui!

Moderatori: cb_123, tonertemplum


 

Re: Corso di information retrieval

Messaggiodi thrantir il 24 apr 2008, 15:22

bella diè!!!!

ps ma dovevi proprio usare font windoziani? :-P
Fletto i muscoli e sono nel vuoto
Principi di architettura degli eleboratori
X postare immagini
-----BEGIN GEEK CODE BLOCK-----
GCS/IT/L/MU d- s: a C++$>+++ UL+>++ P L+++>++++ E--- W++ N++>+++ o+>++ K? w O-- M- VMS? V- PS++ Y+ PGP+ t 5? X+ R++>+++ tv+ b+++>++++ DI+++ D++ G e++ h- r++ y++
------END GEEK CODE BLOCK------
Addio Dani, sono più ricco perchè ti ho conosciuto
Avatar utente
thrantir
Moderatore
Moderatore
 
Messaggi: 8897
Iscritto il: 27 mag 2003, 13:32
Località: Pisa

Re: Corso di information retrieval

Messaggiodi Ibanez89 il 24 apr 2008, 16:00

sarebbe?
CiAo DanIele...

Immagine
Pentium4 Northwood HT 2.6@3000 "230*13" vcore def [RIP] King Value 512*2 200@230 cas2@3 Ati x800gto2@x850pe powered by Arctic Cooler [RIP] Mother ASRock P4VM900-SATA2 [RIP]
insomma poco alla volta mi si sta bruciando tutto :asd:

Immagine
Avatar utente
Ibanez89
AmdPlanet Guru
AmdPlanet Guru
 
Messaggi: 5563
Iscritto il: 15 apr 2006, 17:31
Località: Corato (BA)

Re: Corso di information retrieval

Messaggiodi diegofio il 24 apr 2008, 17:33

ma che stai a scherzare matteo? fai edit sul mio messaggio e vedi come ho costruito quell'obrobrio :lol:
diegofio
AmdPlanet Guru
AmdPlanet Guru
 
Messaggi: 9270
Iscritto il: 29 lug 2005, 09:55

Re: Corso di information retrieval

Messaggiodi diegofio il 24 apr 2008, 17:39

Ibanez89 ha scritto:sarebbe?


guarda qua
viewtopic.php?f=21&t=32264
diegofio
AmdPlanet Guru
AmdPlanet Guru
 
Messaggi: 9270
Iscritto il: 29 lug 2005, 09:55

Re: Corso di information retrieval

Messaggiodi thrantir il 24 apr 2008, 18:39

fatto, fantastico :-)
Fletto i muscoli e sono nel vuoto
Principi di architettura degli eleboratori
X postare immagini
-----BEGIN GEEK CODE BLOCK-----
GCS/IT/L/MU d- s: a C++$>+++ UL+>++ P L+++>++++ E--- W++ N++>+++ o+>++ K? w O-- M- VMS? V- PS++ Y+ PGP+ t 5? X+ R++>+++ tv+ b+++>++++ DI+++ D++ G e++ h- r++ y++
------END GEEK CODE BLOCK------
Addio Dani, sono più ricco perchè ti ho conosciuto
Avatar utente
thrantir
Moderatore
Moderatore
 
Messaggi: 8897
Iscritto il: 27 mag 2003, 13:32
Località: Pisa

Re: Corso di information retrieval

Messaggiodi Galai il 24 apr 2008, 19:03

eheh si parte :D
Sempre in Rete.....There is no place like 127.0.0.1

AmdPlanet ha bisogno di te    

World Community Grid AMD Planet Team

La Romagna suona.. L'Italia balla

Carica le tue foto su PixDiff il nuovo servizio di Hosting & Upload by AmdPlanet

Tutti dicono che sono una persona orribile....ma non è vero....Ho il cuore di un ragazzino.......in un vaso sulla scrivania!!!!


Immagine
Avatar utente
Galai
Moderatore
Moderatore
 
Messaggi: 12521
Iscritto il: 29 ago 2005, 14:11
Località: Cesena

LEZIONE #1: INTRODUZIONE

Messaggiodi diegofio il 26 apr 2008, 13:39

LEZIONE #1: INTRODUZIONE

Scaldo gli animi con una piccola introduzione.
Come comincio? Beh mi pare azzeccato dire che negli ultimi anni la quantità di informazione è cresciuta in maniera più che esponenziale. grazie al web 2.0 tutti gli utenti possono produrre informazione, il web non è più una semplice raccolta di materiale prodotto da poche persone ma diventa sempre più eterogeneo e ricco di contributi personali.
Due numeri: nel 2003 sono stati prodotti 5 esabyte di dati (1 esabyte = 1 miliardo di gigabyte) di cui il 92% su supporto magnetico e solo lo 0,01% su carta stampata; tanto? beh sappiate allora che nel 2006 tale cifra è cresciuta a 161 esabyte e nel 2010 se ne stimano 988 di cui il 70% è autoprodotto dagli utenti che saranno 1,6 miliardi. Considerando che i dati sono calcolati senza contare i messaggi di snakeita :lol: è evidente che ci troviamo di fronte a numeri impressionanti. E povero google che si deve leggere i messaggi di snakeita :lol:

Questi valori giganteschi pongono problemi non solo nel reperire l'informazione ma anche nella sua gestione, gli algoritmi devono essere completamente riscritti: se prima ad esempio pensavate di ordinare una sequenza di dati con un semplice algoritmo senza preoccuparvi della sua dimensione ora non potrete più farlo perchè molto probabilmente tutti quegli interi non ci staranno mai nella vostra minuscola RAM e quindi occorre ingegnarsi per trasferirne un poco alla volta e processarli individualmente, per poi riscriverli su disco in modo opportuno. Ma questa è un altra storia che ho accennato solo per darvi un'idea dei problemi a cui ci si sta trovando di fronte in questi anni.

All'interno di tutto sto macello di roba è necessario districarsi, i motori di ricerca ci devono rispondere nel modo più corretto e veloce possibile quando noi gli chiediamo qualcosa: è evidente che questo è un compito molto difficile, primo perchè "lui" non conosce noi, non sa quali sono le nostre esigenze, queste ultime spesso poste in un linguaggio totalmente incomprensibile ai calcolatori che "ragionano" in modo diverso dal nostro; in secondo luogo perchè le domande degli utenti sono tante (provate a pensare a quante ricerche soddisfa google al secondo!) e come già detto c'è un caos in cui ricercare ciò che chi scrive vorrebbe apparire (possibilmente tra le prime posizioni).

Il problema è molto grosso e ovviamente non riguarda solo il web, poichè un motore di ricerca (o meglio un sistema di reperimento dell'informazione) è presente in una moltitudine di casi. Pensate alla classica biblioteca oppure semplicemente alla casella di testo che vedete in alto a destra in questa pagina. Anche un comune database (ciò che sta dietro a questo forum ad esempio) è un sistema di reperimento dell'informazione, seppur piuttosto particolare. Più che il web, il quale ne è una particolare estensione, saranno soprattutto questi gli oggetti del nostro interesse.

Definizione dovuta: i sistemi di gestione dell'informazione sono sistemi informatici che permettono di memorizzare e trasmettere dati allo scopo di fornire informazione direttamente agli utenti o alle applicazioni che essi utilizzano.

Dimenticavo di dire che finora ho sottinteso che lo scopo e il mezzo della nostra ricerca sia un testo. Beh sappiamo che non sempre è così, e qui siamo nel campo della ricerca vera e propria, tutto si complica enormemente se abbiamo oggetti multimediali come immagini e musica: basti pensare che la musica non è definita solo dal testo ma anche da altre grandezze (ritmo, partitura, melodia...) che devono essere ricavate e valutate appositamente; non è per nulla semplice.

Siamo ai confini della conoscenza di una materia che nasce negli anni cinquanta negli USA e in UK rispettivamente ad Harvard e Cambridge; in Italia i primi ad occuparsi della cosa sono i componenti del centro ricerche FIAT e Siemens negli anni settanta, anche se il primo gruppo di ricerca orientato appositamente a tale disciplina nasce all'università di Padova nel 1987 :win:
Alla prossima.
diegofio
AmdPlanet Guru
AmdPlanet Guru
 
Messaggi: 9270
Iscritto il: 29 lug 2005, 09:55

Re: Corso di information retrieval

Messaggiodi Ibanez89 il 26 apr 2008, 14:58

veramente interessante sfido google ad indicizzare tutti i mex di snake, o meglio spam :asd:
CiAo DanIele...

Immagine
Pentium4 Northwood HT 2.6@3000 "230*13" vcore def [RIP] King Value 512*2 200@230 cas2@3 Ati x800gto2@x850pe powered by Arctic Cooler [RIP] Mother ASRock P4VM900-SATA2 [RIP]
insomma poco alla volta mi si sta bruciando tutto :asd:

Immagine
Avatar utente
Ibanez89
AmdPlanet Guru
AmdPlanet Guru
 
Messaggi: 5563
Iscritto il: 15 apr 2006, 17:31
Località: Corato (BA)

Re: Corso di information retrieval

Messaggiodi Galai il 26 apr 2008, 18:12

già già molto interessante.. aspettiamo il proseguo :D
Sempre in Rete.....There is no place like 127.0.0.1

AmdPlanet ha bisogno di te    

World Community Grid AMD Planet Team

La Romagna suona.. L'Italia balla

Carica le tue foto su PixDiff il nuovo servizio di Hosting & Upload by AmdPlanet

Tutti dicono che sono una persona orribile....ma non è vero....Ho il cuore di un ragazzino.......in un vaso sulla scrivania!!!!


Immagine
Avatar utente
Galai
Moderatore
Moderatore
 
Messaggi: 12521
Iscritto il: 29 ago 2005, 14:11
Località: Cesena

Re: Corso di information retrieval

Messaggiodi jed il 27 apr 2008, 09:46

ciao a tutti, volevo chiedere una cosa inerente le ricerche....come mai quando fai una ricerca di un file, un testo, un immagne o altro, se vado poi a controllare in > strumenti > opzioni internet > cronologia esplorazione > impostazioni file tempporanei internet e cronologia > visualizza file .......all'interno ci sono un mare di file, testi, stringhe,immagini e video che non hanno nulla a che vedere con la mia ricerca e che adirittura io non ho neanche visto al momento della ricerca stessa ?? e qundo poi provo ad aprire uno di questi file o immagie mi chiede conferma e mi dice che : l'esecuzione di comandi di sistema sull'elemento e potenzialmente dannosa ????????? grazie
Avatar utente
jed
Saggio del pianeta
Saggio del pianeta
 
Messaggi: 536
Iscritto il: 01 feb 2008, 18:57
Località: pieve di teco (IM)

Re: Corso di information retrieval

Messaggiodi diegofio il 27 apr 2008, 14:37

non saprei aiutarti perchè non uso internet explorer (presumo tu stia parlando di quello)
diegofio
AmdPlanet Guru
AmdPlanet Guru
 
Messaggi: 9270
Iscritto il: 29 lug 2005, 09:55

Re: Corso di information retrieval

Messaggiodi jed il 27 apr 2008, 17:22

si di explorer ma non fa niente
Avatar utente
jed
Saggio del pianeta
Saggio del pianeta
 
Messaggi: 536
Iscritto il: 01 feb 2008, 18:57
Località: pieve di teco (IM)

LEZIONE #2: DOCUMENTO, COLLEZIONE, RILEVANZA

Messaggiodi diegofio il 05 mag 2008, 12:16

LEZIONE #2: DOCUMENTO, COLLEZIONE, RILEVANZA

Dopo aver introdotto il campo in cui ci muoveremo addentriamoci nella materia vera e propria e prima di tutto diamo la definizione del titolo della disciplina: reperimento dell'informazione identifica tutte le attività necessarie per scegliere, da una data collezione di documenti, quelli di interesse in relazione ad una specifica esigenza informativa di una persona.
Quindi abbiamo due ambiti fondamentali, la persona e il sistema vero e proprio che gli deve rispondere: la prima è alla ricerca di qualcosa che probabilmente si troverà nei documenti della nostra collezione, in pratica ricerca dell'informazione che risolva i suoi problemi di scarsa conoscenza di un determinato argomento come fate voi quando cercate qualcosa, inizialmente sapete ben poco, man mano che trovate documenti la vostra conoscenza aumenta; il sistema a sua volta dovrà essere in grado di rispondere fornendo nei limiti del possibile dei documenti che aumentino la conoscenza della persona, in pratica che gli diano delle informazioni aggiuntive.

Abbiamo introdotto alcuni termini che devono essere definiti meglio: il documento è un oggetto informativo che deve essere identificabile in modo univoco all'interno della collezione e che contiene dei dati che apportano informazione. A sua volta la collezione è costituita da un insieme finito di documenti all'interno dei quali si svolgerà la nostra ricerca. La collezione in cui Google effettua le sue ricerche contiene qualche miliardo di pagine web.

Il processo di ricerca non è molto semplice come sempre avviene quando da una parte c'è un essere umano e dall'altro un sistema automatico: infatti molto spesso l'utente non è esperto e le interrogazioni che sottoporrà saranno in un linguaggio che il sistema non è in grado di comprendere (per esempio una frase nella propria lingua).
Un secondo problema fondamentale è dato dalla rilevanza dei documenti restituiti dal sistema: esso infatti non sa in anticipo quali saranno i documenti che soddisferanno le esigenze informative dell'utente, sicuramente vi sarà successo di avere come risposta da un motore di ricerca dei link che a voi non apportano nessuna informazioni perchè non coerenti con quello che stavate cercando, oppure contenenti delle cose che sapevate già.
Ciò è dato dal fatto che la rilevanza non è qualcosa che un sistema automatico può giudicare in modo perfetto, perchè la vera rilevanza di un documento la sapete solo voi che state facendo la ricerca ed è impossibile sapere con certezza cosa frulla all'interno della testa della persona.
Inoltre se ben ci pensate la rilevanza di un documento varia nel tempo: ipotizziamo che voi cerchiate un qualcosa, man mano che proseguite e leggete materiale voi acquisite della conoscenza che vi permette di giudicare in modo diverso (non da incompetente totale ma dal punto di vista di qualcuno dopo qualche lettura sa già qualcosa sull'argomento) i documenti successivi; un testo che prima avreste giudicato rilevante dopo alcune letture di altri documenti potrebbe non esserlo più poichè, come prima accennato, potrebbe contenere delle cose che già sapevate dalla lettura di risultati precedenti forniti dal motore di ricerca.
diegofio
AmdPlanet Guru
AmdPlanet Guru
 
Messaggi: 9270
Iscritto il: 29 lug 2005, 09:55

Re: Corso di information retrieval

Messaggiodi Ibanez89 il 05 mag 2008, 15:28

:D continua così, molto interessante
CiAo DanIele...

Immagine
Pentium4 Northwood HT 2.6@3000 "230*13" vcore def [RIP] King Value 512*2 200@230 cas2@3 Ati x800gto2@x850pe powered by Arctic Cooler [RIP] Mother ASRock P4VM900-SATA2 [RIP]
insomma poco alla volta mi si sta bruciando tutto :asd:

Immagine
Avatar utente
Ibanez89
AmdPlanet Guru
AmdPlanet Guru
 
Messaggi: 5563
Iscritto il: 15 apr 2006, 17:31
Località: Corato (BA)

 
Prossimo

Torna a Guide

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite

cron