You're surfing the most complete cyber law database.

Glossario tecnico

Glossario tecnico

Le implicazioni legali delle tecnologie emergenti possono essere comprese e valutate soltanto a fronte di una piena conoscenza dei profili tecnici dei fenomeni tech. In questa pagina trovi una selezione delle definizioni -tratte da Wikipedia – dei principali termini IT.

Autovettura autonoma

Un’autovettura autonoma è un veicolo automatico in grado di soddisfare le principali capacità di trasporto di una macchina tradizionale. È in grado di rilevare l’ambiente e la navigazione senza intervento umano. Esistono macchine robotiche principalmente come prototipi e sistemi dimostrativi. Dal 2014 gli unici veicoli autonomi in commercio sono navette all’aperto per zone pedonali che operano a 12,5 miglia all’ora (20,1 km/h). I veicoli autonomi scandagliano l’ambiente con tecniche come radar, lidar, GPS, e visione artificiale. Sistemi di controllo avanzati interpretano le informazioni ricevute per individuare percorsi appropriati, ostacoli e segnaletica rilevante. Per definizione, veicoli autonomi sono in grado di aggiornare le proprie mappe in base a input sensoriali, permettendo ai veicoli di tenere traccia della propria posizione anche quando le condizioni cambiano o quando entrano in ambienti inesplorati. Altri prototipi sono l’auto elettrica Nissan IDS, e il camion Mercedes Future Track 2025 che a settembre 2013 ha percorso in autonomia 110 km da Mannheim a Pforzheim. Nel 2016 è stato rilasciato il primo software open source per la guida automaticaContinua a leggere su Wikipedia.

Bit

La parola bit, in informatica e in teoria dell’informazione, ha due significati molto diversi, a seconda del contesto in cui rispettivamente la si usi. Continua a leggere su Wikipedia.

Bot

Il bot (abbreviazione di robot) in terminologia informatica in generale è un programma che accede alla rete attraverso lo stesso tipo di canali utilizzati dagli utenti umani (per esempio che accede alle pagine Web, invia messaggi in una chat, si muove nei videogiochi, e così via). Programmi di questo tipo sono diffusi in relazione a molti diversi servizi in rete, con scopi vari, ma in genere legati all’automazione di compiti che sarebbero troppo gravosi o complessi per gli utenti umani. Nei paesi anglosassoni, con “Bot” s’intende un programma autonomo che nei social network fa credere all’utente di comunicare con un’altra persona umana. Questi bot migliorano di anno in anno ed è sempre più difficile distinguere un bot da una persona umana.  Continua a leggere su Wikipedia.

Byte

Un byte, il cui nome deriva dalla parola inglese bite (boccone, morso, coniato anche per assonanza col termine “bit” ma rinominato per evitare confusioni accidentali di pronuncia con questo), è una sequenza di bit, il cui numero dipende dall’implementazione fisica della macchina sottostante.Storicamente diversi bit sono utilizzati per codificare un “singolo carattere alfanumerico” in un computer. Il byte è divenuto l’elemento base dell’indirizzabilità nelle architetture dei computer e l’unità di misura delle capacità di memoria. Dal 1964 il byte è formato da 8 bit ed è pertanto in grado di assumere 28 = 256 possibili valori (da 0 a 255). Gli informatici di lingua francese utilizzano il termine octet (ovvero ottetto), sebbene il termine venga utilizzato in inglese per denotare una generica sequenza di otto bitContinua a leggere su Wikipedia.

Browser

In informatica il web browser (o più semplicemente browser) è un’applicazione per il recupero, la presentazione e la navigazione di risorse sul web. Tali risorse (come pagine web, immagini o video) sono messe a disposizione sul World Wide Web (la rete globale che si appoggia su Internet), su una rete locale o sullo stesso computer dove il browser è in esecuzione. Il programmaimplementa da un lato le funzionalità di client per il protocollo HTTP, che regola il download delle risorse dai server web a partire dal loro indirizzo URL; dall’altro quelle di visualizzazione dei contenuti ipertestuali (solitamente all’interno di documenti HTML) e di riproduzione di contenuti multimediali. Tra i browser più utilizzati vi sono Google Chrome, Internet Explorer, Mozilla Firefox, Microsoft Edge (uscito con Windows 10), Safari, Opera e Maxthon. Continua a leggere su Wikipedia.

Cloud computing

In informatica con il termine inglese cloud computing (in italiano nuvola informatica) si indica un paradigma di erogazione di risorse informatiche, come l’archiviazione, l’elaborazione o la trasmissione di dati, caratterizzato dalla disponibilità on demand attraverso Interneta partire da un insieme di risorse preesistenti e configurabili. Le risorse non vengono pienamente configurate e messe in opera dal fornitore apposta per l’utente, ma gli sono assegnate, rapidamente e convenientemente, grazie a procedure automatizzate, a partire da un insieme di risorse condivise con altri utenti lasciando all’utente parte dell’onere della configurazione. Quando l’utente rilascia la risorsa, essa viene similmente riconfigurata nello stato iniziale e rimessa a disposizione nel pool condiviso delle risorse, con altrettanta velocità ed economia per il fornitore. La correttezza nell’uso del termine è contestata da molti esperti: se queste tecnologie sono viste da Rob van der Meulen e Christy Pettey di Gartner come una maggiore evoluzione tecnologica offerta dalla rete Internet[5], da altri, come Richard Stallman, sono invece considerate come una parola ingannevole ideata dal marketing per far cadere gli utenti nel tranello dei software offerti come servizio, che spesso li privano del controllo delle loro attività informaticheContinua a leggere su Wikipedia.

Codice sorgente

Il codice sorgente (spesso detto semplicemente sorgente o codice o listato[1]), in informatica, è il testo di un algoritmo di un programma scritto in un linguaggio di programmazione da parte di un programmatore in fase di programmazione,compresoall’interno di un file sorgente. Esso definisce dunque il flusso di esecuzione del programma stesso. Il sorgente scritto dovrà essere opportunamente elaborato per arrivare a un programma eseguibile dal processore ponendosi dunque come punto di partenza (“sorgente”) dell’intero processo che porta all’esecuzione del programma stesso da parte dell’hardware della macchina, e che può includere altre fasi come precompilazione, compilazione, interpretazione, caricamento e linking (a seconda del tipo di linguaggio di programmazione utilizzato) per concludersi con l’installazione. Per estensione, l’espressione “codice sorgente” viene utilizzata anche per riferirsi a testo scritto in linguaggi informatici non di programmazione, come i linguaggi di markup (HTML, XML e via dicendo) o i linguaggi di database (es. SQL). Nel caso di software proprietario il codice sorgente non è normalmente fornito all’utente dallo sviluppatore come lo è sempre il codice eseguibile per programmi compilati o il bytecode nel caso di programmi interpretati/semiinterpretati, mentre invece è disponibile nel caso di software open source e software liberoContinua a leggere su Wikipedia.

Commutazione di pacchetto (packet-switching)

Nelle telecomunicazioni la commutazione di pacchetto (in inglese packet switching) è una tecnica di accesso multiplo a divisione di tempo, specificamente concepita per il trasporto di dati, utilizzata per condividere un canale di comunicazione tra più nodi in modo non deterministico, suddividendo l’informazione da trasferire in pacchetti trasmessi individualmente e in sequenza. La commutazione di pacchetto trova applicazione nelle reti di calcolatori e più in generale nelle reti di telecomunicazione. Esempi di reti basate sulla commutazione di pacchetto sono le reti locali di calcolatori e InternetContinua a leggere su Wikipedia.

Database 

Con base di dati o banca dati (a volte abbreviato con la sigla DB dall’inglese data base) in informatica si indica un insieme di dati, omogeneo per contenuti e per formato, memorizzati in un elaboratore elettronico e interrogabili via terminaleutilizzando le chiavi di accesso previste. Continua a leggere su Wikipedia.

Data mining

Il data mining è l’insieme delle tecniche e delle metodologie che hanno per oggetto l’estrazione di informazioni utili da grandi quantità di dati (attraverso metodi automatici o semi-automatici) e l’utilizzo scientifico, industriale o operativo delle stesse. Continua a leggere su Wikipedia.

Deep learning

L’apprendimento profondo (in inglese deep learning) è quel campo di ricerca dell’apprendimento automatico (in inglese machine learning) e dell’intelligenza artificiale che si basa su diversi livelli di rappresentazione, corrispondenti a gerarchie di caratteristiche di fattori o concetti, dove i concetti di alto livello sono definiti sulla base di quelli di basso. Tra le architetture di apprendimento profondo si annoverano le reti neurali profonde, la convoluzione di reti neurali profonde, le Deep belief network, e reti neurali ricorsive, che sono state applicate nella computer vision, nel riconoscimento automatico del discorso, nell’elaborazione del linguaggio naturale, nel riconoscimento audio e nella bioinformatica. “Deep learning” è un’espressione oggi famosa che ridà lustro al concetto di rete neurale. Continua a leggere su Wikipedia.

Download

Il download, o scaricamento, indica in informatica l’azione di ricevere o prelevare da una rete telematica (ad esempio da un sito web) un file, trasferendolo sul disco rigido del computer o su altra periferica dell’utente. Nella maggior parte dei casi lo scaricamento di un file è la conseguenza di una richiesta, più o meno trasparente all’utente del sistema. L’azione inversa è invece detta upload. Continua a leggere su Wikipedia.

Drone

Un aeromobile a pilotaggio remoto o APR, comunemente noto come drone, è un velivolocaratterizzato dall’assenza del pilota umano a bordo. Il suo volo è controllato dal computer a bordo del velivolo, sotto il controllo remoto di un navigatore o pilota, sul terreno o in un altro veicolo. L’inclusione del termine aeromobile sottolinea che, indipendentemente dalla posizione del pilota e/o dell’equipaggio di volo, le operazioni devono rispettare le regole e le procedure degli aerei con pilota ed equipaggio di volo a bordoContinua a leggere su Wikipedia.

Hosting

In informatica si definisce hosting(dall’inglese to host, ospitare) un serviziodi rete che consiste nell’allocare su un server web le pagine web di un sito web o un’applicazione web, rendendolo così accessibile dalla rete Internet e ai suoi utenti. Tale “server web”, definito “host”, è connesso ad Internet in modalità idonea a garantire l’accesso alle pagine del sito mediante il web browser dell’host clientdell’utente, con identificazione dei contenuti tramite dominio ed indirizzo IP. Il servizio può essere gratuito o a pagamento, tipicamente a qualità maggiore nel secondo caso. La fornitura di servizi di connessione ad Internet, hosting, housing, e servizi connessi, è oggi un settore economico molto specifico, compreso all’interno dell’ICT, in cui operano molte realtà nazionali, ma anche grandi aziende transnazionali. Pur essendo possibile ospitare il proprio sito web su un server o spazio FTP all’interno della propria infrastruttura, è prassi che ci si rivolga ai servizi forniti da imprese specializzate: provider, data center, società di telecomunicazioni, etc. Quanto sopra riportato descrive più propriamente un web hosting: esiste anche l’hosting relativo a servizi infrastrutturali ovvero l’host network. Continua a leggere su Wikipedia.

HyperText Markup Language (HTML)

In informatica l’HyperText Markup Language (HTML) è un linguaggio di markup. Nato per la formattazione e impaginazione di documenti ipertestuali disponibili nel web 1.0, oggi è utilizzato principalmente per il disaccoppiamento della struttura logica di una pagina web (definita appunto dal markup) e la sua rappresentazione, gestita tramite gli stili CSS per adattarsi alle nuove esigenze di comunicazione e pubblicazione all’interno di Internet. L’HTML è un linguaggio di pubblico dominio, la cui sintassi è stabilita dal World Wide Web Consortium (W3C). È derivato dall’SGML, un metalinguaggio finalizzato alla definizione di linguaggi utilizzabili per la stesura di documenti destinati alla trasmissione in formato elettronico. La versione attuale, la quinta, è stata rilasciata dal W3C nell’ottobre 2014. Il motivo principale che ha spinto il W3C e i suoi membri a sviluppare HTML5 è stata la necessità di fornire direttamente le funzionalità che in precedenza erano fruibili tramite estensioni proprietarie all’esterno dei browser, come Adobe Flash e simili. Un secondo obiettivo che gli sviluppatori si erano prefissati era quello di garantire una maggiore compatibilità tra i diversi browser, indipendentemente dalla piattaforma software utilizzata, e principalmente mirata all’espansione dei dispositivi mobili[Continua a leggere su Wikipedia.

Intelligenza artificiale

Definizioni specifiche possono essere date focalizzandosi o sui processi interni di ragionamento o sul comportamento esterno del sistema intelligente ed utilizzando come misura di efficacia o la somiglianza con il comportamento umano o con un comportamento ideale, detto razionale: 1) Agire umanamente: il risultato dell’operazione compiuta dal sistema intelligente non è distinguibile da quella svolta da un umano. 2) Pensare umanamente: il processo che porta il sistema intelligente a risolvere un problema ricalca quello umano. Questo approccio è associato alle scienze cognitive. 3) Pensare razionalmente: il processo che porta il sistema intelligente a risolvere un problema è un procedimento formale che si rifà alla logica. 4) Agire razionalmente: il processo che porta il sistema intelligente a risolvere il problema è quello che gli permette di ottenere il miglior risultato atteso date le informazioni a disposizione.
L’intelligenza artificiale è una disciplina dibattuta tra scienziati e filosofi poiché manifesta aspetti etici oltre che teorici e praticiContinua a leggere su Wikipedia.

Java

In informatica Java è un linguaggio di programmazione ad alto livello, orientato agli oggetti e a tipizzazione statica, specificatamente progettato per essere il più possibile indipendente dalla piattaforma di esecuzione. Continua a leggere su Wikipedia.

Joint Photographic Experts Group (JPEG)

JPEG è l’acronimo di Joint Photographic Experts Group, un comitato di esperti ISO/CCITT che ha definito il primo standardinternazionale di compressione dell’immagine digitale a tono continuo, sia a livelli di grigio sia a colori. La stessa combinazione di caratteri indica anche il diffusissimo formato di compressione a perdita di informazioni, che è disponibile in formato aperto e a implementazione libera. JPEG è divenuto il più diffuso standard di compressione delle immagini fotograficheContinua a leggere su Wikipedia.

Linguaggio di programmazione

Un linguaggio di programmazione, in informatica, è un linguaggio formale che specifica un insieme di istruzioni che possono essere usate per produrre dati in output. Esso è utilizzabile per il controllo del comportamento di una macchina formale o di una implementazione di essa (tipicamente, un computer) ovvero in fase di programmazione di questa attraverso la scrittura del codice sorgente di un programma ad opera di un programmatore. Un linguaggio di programmazione è considerato a tutti gli effetti tale se è Turing-completo. Continua a leggere su Wikipedia.

Linking

Il linking (letteralmente “collegamento”) è il procedimento di integrazione dei vari moduli a cui un programma fa riferimento (i quali possono essere sottoprogrammi o librerie), per creare una singola unità eseguibile. Il linker (o link editor) è un programma che effettua il collegamento tra il programma oggetto, cioè la traduzione del codice sorgente in linguaggio macchina, e le librerie del linguaggio necessarie per l’esecuzione del programma. Continua a leggere su Wikipedia.

Machine learning

L’apprendimento automatico (anche chiamato machine learning dall’inglese) rappresenta un insieme di metodi sviluppati a partire dagli ultimi decenni del ‘900 in varie comunità scientifiche con diversi nomi come: statistica computazionale, riconoscimento di pattern, reti neurali artificiali, filtraggio adattivo, teoria dei sistemi dinamici, elaborazione delle immagini, data mining, algoritmi adattivi, ecc; che “fornisce ai computer l’abilità di apprendere senza essere stati esplicitamente programmati”. Lo stesso Arthur Samuel che coniò il termine nel 1959 in linea di principio identifica due approcci distinti. Il primo metodo, indicato come rete neurale, porta allo sviluppo di macchine ad apprendimento automatico per impiego generale in cui il comportamento è appreso da una rete di commutazione connessa casualmente, a seguito di una routine di apprendimento basata su ricompensa e punizione (apprendimento per rinforzo). Il secondo metodo, più specifico, consiste nel riprodurre l’equivalente di una rete altamente organizzata progettata per imparare solo alcune attività specifiche. La seconda procedura, che necessita di supervisione, richiede la riprogrammazione per ogni nuova applicazione ma risulta essere molto più efficiente dal punto di vista computazionale. Continua a leggere su Wikipedia.

Motore di ricerca

Nell’ambito delle tecnologie di Internet, un motore di ricerca (in inglese search engine) è un sistema automatico che, su richiesta, analizza un insieme di dati (spesso da esso stesso raccolti) e restituisce un indice dei contenuti disponibili classificandoli in modo automatico in base a formule statistico-matematiche che ne indichino il grado di rilevanza data una determinata chiave di ricerca. Uno dei campi in cui i motori di ricerca trovano maggiore utilizzo è quello dell’information retrieval e nel web. I motori di ricerca più utilizzati nel 2017 sono stati: Google, Bing, Baidu, Qwant, Yandex, Ecosia, DuckDuckGo. Continua a leggere su Wikipedia.

Open source

In informatica, il termine inglese open source (che significa sorgente aperta) viene utilizzato per riferirsi ad un software di cui gli autori (più precisamente, i detentori dei diritti) rendono pubblico il codice sorgente, favorendone il libero studio e permettendo a programmatori indipendenti di apportarvi modifiche ed estensioni. Questa possibilità è regolata tramite l’applicazione di apposite licenze d’uso. Il fenomeno ha tratto grande beneficio da Internet, perché esso permette a programmatori distanti di coordinarsi e lavorare allo stesso progetto. Alla filosofia del movimento open source si ispira il movimento open content(contenuti aperti): in questo caso, ad essere liberamente disponibile non è il codice sorgente di un software, ma contenuti editoriali quali testi, immagini, video e musica. Wikipedia è un chiaro esempio dei frutti di questo movimento. Attualmente, l’open source tende ad assumere rilievo filosofico, consistendo in una nuova concezione della vita, aperta e refrattaria ad ogni oscurantismo, che l’open source si propone di superare mediante la condivisione della conoscenza. Open source e software libero, seppure siano sovente utilizzati come sinonimi, hanno definizioni differenti: l’Open Source Initiative ha definito il termine “open source” per descrivere soprattutto libertà sul codice sorgente di un’opera. Il concetto di software libero descrive più generalmente le libertà applicate ad un’opera, ed è prerequisito che il suo codice sia consultabile e modificabile, rientrando generalmente nella definizione di open source. Continua a leggere su Wikipedia.

Pagina web

Una pagina web è il tipo di documento digitale tramite il quale sono rese disponibili all’utente finale le informazioni del World Wide Web tramite un web browser. Un insieme di pagine web, tra loro relazionate secondo una gerarchica e una struttura ipertestuale e riferibili, di norma, ad un unico web server, costituiscono un sito web. Continua a leggere su Wikipedia.

Portable Network Graphics (PNG)

In informatica, il PNG (Portable Network Graphics) è un formato di file per memorizzare immagini. Continua a leggere su Wikipedia.

Robot

Un robot (pron. robòt o robó, all’ingleseròbot; dalla parola ceca robota che significa lavoro pesante, a propria volta derivata dall’antico slavo ecclesiasticorabota, servitù), raramente italianizzato in roboto (ròboto), è una qualsiasi macchina (più o meno antropomorfa) in grado di svolgere più o meno indipendentemente un lavoro al posto dell’uomo. Continua a leggere su Wikipedia.

Semantic web

Con il termine web semantico, termine coniato dal suo ideatore, Tim Berners-Lee, si intende la trasformazione del World Wide Web in un ambiente dove i documenti pubblicati (pagine HTML, file, immagini, e così via) sono associati ad informazioni e dati (metadati) che ne specificano il contesto semantico in un formato adatto all’interrogazione e l’interpretazione (es. tramite motori di ricerca) e, più in generale, all’elaborazione automatica. Con l’interpretazione del contenuto dei documenti che il Web semantico impone, saranno possibili ricerche molto più evolute delle attuali, basate sulla presenza nel documento di parole chiave, e altre operazioni specialistiche come la costruzione di reti di relazioni e connessioni tra documenti secondo logiche più elaborate del semplice collegamento ipertestualeContinua a leggere su Wikipedia.

Sistema dei nomi a dominio

Il sistema dei nomi di dominio (in inglese: Domain Name System, DNS), è un sistema utilizzato per la risoluzione di nomi dei nodi della rete (in inglese: host) in indirizzi IP. Il servizio è realizzato tramite un database distribuito, costituito dai server DNS. Il DNS ha una struttura gerarchica ad albero rovesciato ed è diviso in domini (com, org, it, ecc.). Ad ogni dominio o nodo corrisponde un nameserver, che conserva un database con le informazioni di alcuni domini di cui è responsabile e si rivolge ai nodi successivi quando deve trovare informazioni che appartengono ad altri domini. Ogni nome di dominio termina con un “.” (punto). Ad esempio l’indirizzo wikipedia.org termina con il punto. La stringa vuota che segue il punto finale è chiamata dominio radice (DNS root zone). I server responsabili del dominio radice sono i cosiddetti root nameservers. Essi possiedono l’elenco dei server autoritativi di tutti i domini di primo livello (TLD) riconosciuti e lo forniscono in risposta a ciascuna richiesta. I root nameserver sono 13 in tutto il mondo, di cui 10 negli Stati Uniti, due in Europa (Inghilterra e Svezia) ed uno in GiapponeContinua a leggere su Wikipedia.

Sito web

Un sito web o sito Internet (anche abbreviato in sito se chiaro il contesto informatico) è un insieme di pagine web correlate, ovvero una struttura ipertestualedi documenti che risiede su un server web. Continua a leggere su Wikipedia.

Software

Il software in informatica è l’informazione o le informazioni utilizzate da uno o più sistemi informaticie memorizzate su uno o più supporti informatici. Tali informazioni possono essere rappresentate da uno o più programmi, da uno o più dati, oppure da una combinazione delle due. Il termine si contrappone tradizionalmente ad hardware (la componente fisica di un sistema di calcolo), che rende possibile l’esecuzione del software (la componente logica dello stesso). Nel tempo sono entrati nell’uso altri termini che descrivono elementi di un computer, come il firmware. Il suffisso -ware (il cui significato è «componente») viene usato anche in altri termini che indicano particolari tipi di programmi: in funzione del ruolo che hanno in un sistema di calcolo (per esempio middleware), del tipo di licenza con cui sono distribuiti (freeware, shareware), dell’edizione e altro ancora. Continua a leggere su Wikipedia.

Software libero 

Il software libero è un software pubblicato sotto i termini di una licenza di software libero, che ne concede l’utilizzo, lo studio, la modifica e la redistribuzione. Continua a leggere su Wikipedia.

Software proprietario

Il software proprietario, chiamato anche privato, non libero, o closed source, è un software la cui licenza consente al beneficiario il suo utilizzo sotto particolari condizioni ed impedendone altre come la modifica, la condivisione, lo studio, la ridistribuzione o l’ingegneria inversa. Le restrizioni sono imposte dal titolare dei diritti di sfruttamento economico, cioè l’autore o – in caso di cessione dei diritti patrimoniali – il cessionario dei diritti in questione, tramite mezzi primariamente giuridici, come limitazioni nel contratto di licenza al regime di circolazione dei sorgenti o brevetti, nei paesi nei quali sono consentiti. Le modalità di limitazione sono spesso anche di natura tecnica, quando, ad esempio il software è pubblicato soltanto in codice binario tenendone segreto il codice sorgente. Questa semplice pratica rende infatti lo studio e la modifica tecnicamente infattibile: utilizzando disassemblatori sono necessarie elevate capacità informatiche e notevoli sforzi per ottenere informazioni o effettuare modifiche anche solo di minima entità. Continua a leggere su Wikipedia.

Streaming

Il termine streaming, nel campo delle telecomunicazioni, identifica un flusso di dati audio/video trasmessi da una sorgente a una o più destinazioni tramite una rete telematica. Questi dati vengono riprodotti man mano che arrivano a destinazione. Continua a leggere su Wikipedia.

Uniform Resource Locator (URL)

La locuzione Uniform Resource Locator (in acronimo URL), nella terminologia delle telecomunicazioni e dell’informatica, è una sequenza di caratteri che identifica univocamente l’indirizzo di una risorsa in Internet, tipicamente presente su un hostserver, come ad esempio un documento, un’immagine, un video, rendendola accessibile ad un client. L’URL di solito è una sequenza di caratteri indipendente dal web, e anche se il tipo più comune identifica risorse web (http), è vastamente utilizzato dai programmatori per indicare risorse recuperabili tramite protocolli di trasferimento file (ftp), condivisioni remote (smb), o accessi a sistemi esterni (ssh). Continua a leggere su Wikipedia.

Web caching

Il Web caching è la caching di documenti web (pagine HTML, immagini, ecc.) per permettere di ridurre l’uso della banda e il tempo di accesso ad un sito web. Una web cache memorizza copie di documenti richiesti dagli utenti, successive richieste possono essere soddisfatte dalla cache se si presentano certe condizioni. Le Web cache di solito raggiungono picchi d’efficienza nell’ordine del 30%-50%, e migliorano la loro efficienza al crescere del numero di utenti. Continua a leggere su Wikipedia.

Web scraping

Il web scraping (detto anche web harvesting o web data extraction) è una tecnica informatica di estrazione di dati da un sito web per mezzo di programmisoftware. Di solito, tali programmi simulano la navigazione umana nel World Wide Web utilizzando l’Hypertext Transfer Protocol (HTTP) o attraverso browser, come Internet Explorer o Mozilla Firefox. Il web scraping è strettamente correlato all’indicizzazione dei siti Internet; tale tecnica è attuata mediante l’uso di bot dalla maggior parte dei motori di ricerca. D’altro canto, il web scraping si concentra di più sulla trasformazione di dati non strutturati presenti in Rete, di solito in formato HTML, in metadati che possono essere memorizzati e analizzati in locale in un database. Il web harvesting è altresì affine alla web automation, che consiste nella simulazione della navigazione umana in Rete attraverso l’uso di software per computerContinua a leggere su Wikipedia.

World Wide Web

Il World Wide Web (letteralmente “rete di grandezza mondiale”), abbreviato Web, sigla WWW o W3, è uno dei principali servizi di Internet, che permette di navigare e usufruire di un insieme molto vasto di contenuti amatoriali e professionali (multimediali e non) collegati tra loro attraverso legami (link), e di ulteriori servizi accessibili a tutti o ad una parte selezionata degli utenti di Internet. Questa facile reperibilità di informazioni è resa possibile, oltre che dai protocolli di rete, anche dalla presenza, diffusione, facilità d’uso ed efficienza dei motori di ricerca e dei web browser in un modello di architettura di rete definito client-server. Continua a leggere su Wikipedia.