Home Faq » FAQ generiche
FAQ generiche
DOMANDE
RISPOSTE
  1. A chi appartiene un dominio registrato?
    Non esiste un proprietario, ma soltanto un assegnatario, cioè la persona a cui è stato assegnato su richiesta il dominio (persona fisica, società, associazione, ecc.), che è anche responsabile dell’utilizzo che ne viene fatto, con tutte le conseguenze del caso.

    [Back to top]
  2. A cosa serve il file robots.txt?
    Il file robots.txt permette ai webmaster e agli amministratori di sistema di indicare agli spider dei motori di ricerca quali pagine HTML non debbano essere esaminate.

    Lo standard per l'esclusione dei robot/spider si avvale dell'utilizzo di un normale file di testo, da creare attraverso un qualunque text editor (es. Notepad / Blocco Note di Windows). Tale file va chiamato "robots.txt" e contiene, in un particolare formato, delle istruzioni che possono impedire a tutti o alcuni spider il prelievo di alcune o tutte le pagine del sito.

    Il file robots.txt va creato e pubblicato on-line nella directory principale del sito web. Ad esempio, se il sito ha indirizzo http://www.nomesito.xxx , il file dovrà essere accessibile all'indirizzo http://www.nomesito.xxx/robots.txt .

    Tutti gli spider di quei motori di ricerca che hanno deciso di aderire a questo standard e di seguire le indicazioni del file robots.txt, ogni volta che accederanno al sito web, per prima cosa andranno a cercare nella directory principale il suddetto file e, se lo troveranno, seguiranno le direttive contenute al suo interno.

    Contenuti del file robots.txt

    Il file robots.txt contiene una lista di pagine e directory che gli spider NON possono prelevare.

    Ciò significa che non esiste una istruzione per dire allo spider: "puoi prelevare questa pagina" ma esistono solo istruzioni per dirgli: "NON puoi prelevare questa pagina". Non a caso lo standard si chiama Standard per l'esclusione dei robot.

    Quanto appena specificato è estremamente importante, in quanto molti degli errori che i webmaster spesso inseriscono nei file robots.txt hanno origine dall'errata comprensione di ciò che è possibile fare con essi.

    Se non avete la necessità di impedire ai motodi ricerca di prelevare alcune (o tutte) pagine del vostro sito, allora il file robots.txt non vi serve.

    Formato di robots.txt

    Il file robots.txt contiene dei record, ognuno dei quali comprende due campi: il campo "User-agent" ed uno o più campi "Disallow".

    Il campo User-agent serve ad indicare a quale robot/spider le direttive successive sono rivolte. La sua sintassi è:

    User-agent <duepunti> <spazio> <nome_dello_spider>

    Il campo Disallow serve a indicare a quali file e/o directory non può accedere lo spider indicato nel campo User-agent. La sintassi di questo campo è:

    Disallow <duepunti> <spazio> <nome_del_file_o_directory>

    Esempio di un record:

    User-agent: googlebot
    Disallow: /testi.html
    Disallow: /poesie/

    Il suddetto record dice a Google ("googlebot" è il nome dello spider di Google) che non gli è permesso prelevare il file testi.html nè accedere alla directory "poesie" e ai suoi contenuti, sottodirectory comprese. Notate come il nome del file è preceduto da un carattere "/" (che indica la directory principale del sito) e come il nome della directory fa uso di un carattere "/" anche in coda.

    Il campo User-agent può contenere un asterisco "*", sinonimo di "qualunque spider". Per cui l'esempio seguente dice a tutti gli spider di non prelevare il file temporaneo.html:

    User-agent: *
    Disallow: /temporaneo.html

    Il campo Disallow può contenere un carattere "/" ad indicare "qualunque file e directory". L'esempio che segue impedisce a scooter (lo spider di Altavista) di prelevare qualunque cosa:

    User-agent: scooter
    Disallow: /

    Infine, il campo Disallow può essere lasciato vuoto, ad indicare che non ci sono file o directory di cui si vuole impedire il prelievo. L'esempio seguente mostra come dire a tutti i motori di ricerca di prelevare tutti i file del sito:

    User-agent: *
    Disallow:

    Esempio di un file robots.txt

    Come scritto pocanzi, il file robots.txt si compone di uno o più record, ognuno dei quali prende in esame spider differenti. Ecco dunque un esempio completo di file robots.txt, che blocca del tutto Altavista, impedisce a Google l'accesso ad alcuni file e directory e lascia libero accesso a tutti gli altri motori di ricerca.

    User-agent: scooter
    Disallow: /

    User-agent: googlebot
    Disallow: /intestazione.html
    Disallow: /links.html
    Disallow: /temporanei/
    Disallow: /cgi-bin/

    User-agent: *
    Disallow:

    Lista degli spider

    Di seguito una breve lista con i nomi degli spider dei principali motori di ricerca internazionali:

    Spider            Motore di ricerca
    ========================
    googlebot       Google
    fast            Fast - Alltheweb
    slurp           Inktomi - Yahoo!
    scooter         Altavista
    mercator        Altavista
    Ask Jeeves      Ask Jeeves
    teoma_agent     Teoma
    ia_archiver     Alexa - Internet Archive

    Il nome (User-agent) degli spider di altri motori di ricerca può essere individuato cercando nei log del server HTTP che gestisce il sito web oppure consultando le pagine dei motori di ricerca dedicate ai webmaster. Quasi sempre, vengono indicati i nomi degli spider e come bloccarli usando il file robots.txt.

    Altre informazioni utili

    Nel caso in cui voleste inserire all'interno del file robots.txt alcuni commenti, potete farlo scrivendo righe di testo il cui primo carattere è un "cancelletto" #. Tali righe verranno completamente ignorate dagli spider dei motori. Esempio:

    User-agent: *
    # Non voglio che i motori di ricerca cerchino le pagine
    # della mia directory "personale".
    Disallow: /personale/

    Consigliamo di aderire scrupolosamente alla sintassi utilizzata negli esempi riportati. Prestate attenzione a non dimenticare i due punti e lo spazio prima del contenuto del campo.

    Quando gli spider non trovano il file robots.txt, si comportano come se avessero ricevuto via libera ed accederanno dunque a tutte le pagine trovate nel sito.


    [Back to top]
  3. Che cosa è un dominio?
    Un dominio è un nome che identifica in Internet a livello univoco un'azienda, associazione o privato (esempio: tol.it). Le prime lettere in un nome di dominio rappresentano il protocollo di comunicazione (solitamente www per i siti web); le ultime lettere, dette anche estensione, indicano la nazione o il tipo di organizzazione:
    .com     ideato inizialmente per il business e le attività commerciali - non ha limitazioni, può essere registrato da qualsiasi persona fisica o giuridica
    .org     ideato inizialmente per le organizzazioni - non ha limitazioni, può essere registrato da qualsiasi persona fisica o giuridica
    .net     ideato inizialmente per le attività legate alle rete Internet - non ha limitazioni, può essere registrato da qualsiasi persona fisica o giuridica
    .info     ideato inizialmente per le attività informative - non ha limitazioni, può essere registrato da qualsiasi persona fisica o giuridica
    .biz     ideato per il business e dedicato alle aziende e società commerciali, in realtà è senza limitazioni
    .it     è l'estensione nazionale italiana - può essere registrato da persone, società, enti pubblici, professionisti e associazioni

    Il nome di un dominio è tecnicamente un nome associato ad un indirizzo IP. Quando viene richiesta da un utente la connessione ad un sito tramite la digitazione del nome, i server denominati Domain Name Server (DNS) traducono il dominio nell'indirizzo IP corrispondente.

    [Back to top]
  4. Che cosa sono le Regole di Naming?
    E’ il documento che regolamenta l’assegnazione dei nomi a dominio e puo essere consultato sul sito del NIC.

    [Back to top]
  5. Che cosè un protocollo?
    Un protocollo è un insieme di regole che stabiliscono una base comune di comunicazione. In questo modo computer e apparecchiature con caratteristiche diverse possono scambiarsi dati e informazioni.

    [Back to top]
  6. Che cos’è un DNS?
    I nomi a dominio sono stati creati per dare una percezione più immediata dei domini per l’uomo. Infatti l’indirizzo usato dai computer per trovare un sito è un indirizzo numerico ossia indirizzo IP (Internet Protocol Address) es. 162.138.122.1. Il DNS (Domain Name Service) è il sistema di traduzione da indirizzo IP usato dai computer a indirizzo mnemonico e viceversa.

    [Back to top]
  7. Che cos’è un indirizzo IP?
    E’ l’indirizzo di un computer collegato ad internet che ospita dei siti Web. E’ composto da 4 cifre separate da un punto che vanno da 0 a 255 e può appartenere alla classe A, B, C o D. Questo per quanto riguarda lo standard IPV4, ma data limitatezza degli indirizzi disponibili con questo metodo è stato creato lo standard IPV6, che da la possibilità di pressoché infiniti indirizzi IP possibili, garantendo uno sviluppo di internet senza limiti. Questo nuovo standard viene già adottato anche se non ancora da tutti i provider.

    [Back to top]
  8. Che cos’è un Maintainer?
    Si tratta di un Provider autorizzato dai vari registri a gestire i dati relativi ai domini e funge da interfaccia tra il registro ed il registrante. Docitalia è un maintainer accreditato presso il Registro Italiano del ccTLD ".it".

    [Back to top]
  9. Che cos’è un TLD?
    Il TLD (Top Level Domain) è il suffisso dell’indirizzo Internet e può essere generico (es.: .com, .net, .org, .biz, .info) oppure nazionale (es.: .it per i domini italiani).

    [Back to top]
  10. Cos'è un RSS?
    RSS (un acronimo per "Rich Site Summary" o, la versione più recente, per "Really Simple Syndication") è un metodo usato dai siti web per creare un sommario del proprio contenuto, come articoli e notizie, rendendoli consultabili in un formato alternativo. Ad esempio molti siti mettono a disposizione un feed RSS delle proprie notizie, in modo che sia possibile vederli come segnalibro Live sul browser Firefox oppure come e-mail in Thunderbird. Sicuramente quasi tutti i vostri blog preferiti forniscono un feed RSS.

    [Back to top]
  11. Cosa è il redirect 301? A cosa serve?
    Il redirect 301 è un sistema di ridirezionamento particolarmente utile ed adatto ai motori di ricerca.

    In particolare si dimostra molto utile nei casi in cui:

       1. si voglia cambiare il nome di un sito in altro il cui dominio sia maggiormente strategico (es. keywords nel nome di dominio) trasferendo così tutti i contenuti nel nuovo dominio;
       2. sistemare il traffico di tipo http://www e http://, il cui page rank sembra essere ormai particolarmente minacciato da Google;
       3. proteggere il marchio acquisendo una serie di altri domini attivati con lo scopo di sottrarre domini strategici alla concorrenza.

    Cosa è il redirect 301? Come indicato sugli Status Code Definitions [RFC 2616] il numero 301 è un codice intestazione a livello server che viene generato quando un browser o lo spider di un motore di ricerca cerca di fare il download della pagina web. Il codice 301 dice che "la pagina è stata PERMANENTEMENTE SPOSTATA ("301 Moved Permanently") verso un nuovo indirizzo". Conseguentemente, i browsers e gli spiders si autodirigono verso il nuovo indirizzo che viene specificato sul file .htaccess.

    Il file .htaccess è un semplice file di testo che risiede sulla directory principale del sito (dove risiede anche la home page del sito stesso). Questo file serve in realtà ad una quantità di svariate funzioni e può anche stare in altre directories, oltre che su quella principale.

    Se questo file non esiste ancora sul vostro sito web, è facile crearlo utilizzando un semplice editor testuale salvandolo come .htaccess.

    Se invece questo file esiste e risiede già sul vostro sito web, allora potete editarlo e se volete aggiungere il redirect 301 potete inserirlo alla fine del file (nella parte in basso del testo) facendolo partire da una nuova riga.

    Mentre potrebbe sembrare una cosa difficile da fare, in realtà quanto detto è estremamente semplice.

    Le ragioni per utilizzare il redirect 301 possono essere diverse:

       1. per cambiare il nome di dominio (a volte la cosa è necessaria ad esempio quando ci sono trasformazioni aziendali che modificano la ragione sociale e quindi l'intestazione del nome aziendale);
       2. per assicurasi che gli spiders dei motori di ricerca indicizzino SOLO le pagine web residenti sulla struttura www piuttosto che non-www del sito, evitando conseguentemente l'indicizzazione di contenuti doppi che portano, se individuate dall'apposito filtro di Google, a forti penalizzazioni in quanto considerate spam;
       3. per portare traffico da domini secondari verso il dominio principale senza pubblicare contenuti duplicati che sarebbero penalizzati. D'altronde è prassi comune ed anche buona strategia quella di acquisire nomi di dominio attinenti l'azienda (es. sito.com, .net, .it ecc.) che se lasciati liberi potrebbero essere utilizzati dalla concorrenza.

    Nell'ultima riga del file .htaccess occorre inserire il seguente codice:

    redirect 301 / http://www.nuovo-dominio.com/

    Attenzione: questo comando di una riga funziona SOLO se manterrete sul nuovo sito la medesima struttura del vecchio sito. Se questo presupposto viene osservato allora ogni pagina del vecchio dominio verrà reindirizzata alla pagina gemella del nuovo sito. Se sul nuovo sito, ad esempio, mancassero pagine web presenti nel vecchio, allora gli spiders cercherebbero di trovare le pagine reindirizzate assenti sul sito nuovo andando incontro ad una serie di 404 errors (pagina non trovata) e ciò con ben poco beneficio del posizionamento del sito.

    Soltanto dopo che il processo di trasferimento sarà completato (i logs del vecchio sito dimostreranno che non c'è più alcun traffico), solo allora potrete cominciare a fare nuove variazioni alla struttura del sito web.

    E' possibile anche effettuare il redirect 301 su una directory come nel caso sottoindicato:

    redirect 301 /nomedirectory/ http://www.nuovo-dominio.com/nome-directory/

    Così come è possibile effettuare il redirect 301 anche su pagine singole:

    redirect 301 /nome-directory/nome-paginaweb.htm http://www.nuovo-dominio.com/nome-directory/nome-paginaweb.htm

    Una volta settato il redirect è bene utilizzare un tool che osservi il buon funzionamento del codice settato. [es. vedi questo link]

    Il file .htaccess è utilizzabile sui server Unix (o basati su Linux) non anche sui server Windows per i quali rimandiamo ad altro articolo delle FAQ


    [Back to top]
  12. Cosa e' il redirect? Come si realizza un redirect?
    Attraverso la procedura del redirect è possibile inoltrare le visite di un sito web verso un altro sito web senza che l'utente se ne accorga. Inoltre è possibile inoltrare un messaggio di posta elettronica ad un indirizzo diverso.

    Esempi di Redirect ad un'altra pagina web tramite script HTML/JS/PHP/ASP/JSP/Coldfusion

    Esempio di redirezione in HTML [file da creare "index.htm"]



    Esempio di redirezione in JavaScript [file da creare "index.htm"]



    Esempio di redirezione in PHP [file da creare "index.php"]



    Esempio di redirezione in ASP [file da creare "default.asp"]

    Esempio di redirezione in JSP [file da creare "index.jsp"]

    Il redirect in una pagina JSP puo' essere implementato inserendo un richiamo alla funzione response.sendRedirect() in uno scriptlet. Ogni output generato deve essere posto dopo questo richiamo, altrimenti la pagina mosterà un errore del tipo "exception".

    Esempio di redirezione in Coldfusion [file da creare "index.cf"].

    Il tag <cflocation> esegue un "redirect" del browser alla pagina specificata nell'attributo URL


    [Back to top]
  13. Cosa significa DNS? Come funziona un DNS?
    È una sigla che sta per DOMAIN NAME SYSTEM. Il DNS gestisce la traduzione di un nome di dominio in un numero IP (detta risoluzione diretta) e viceversa da un numero IP ad un nome di dominio (detta risoluzione inversa).

    Come funziona l' interrogazione di un DNS:

    Quando voi richiedete la risoluzione di un nome per esempio www.spazioweb.com il vostro DNS Server generalmente controlla nella sua cache, se non ha il risultato allora contatta direttamente uno dei cosiddetti Root Server.  I Root Servers sono dei server che gestiscono le zone/estensioni (.com, .org, .net, .edu, ecc.) le più famose per intenderci. Se voi quindi cercate un sito .com il vostro DNS contatta uno di questi Top Server, come risposta avrà un'altra serie di DNS Server che gestiscono la particolare estensione .com.
    Verrà fatta richiesta quindi ad uno di questi server, che daranno come risposta una lista di server che gestiscono il dominio particolare spazioweb.com.
    All'ultimo passaggio al server che gestisce il dominio spazioweb.com verrà richiesto di tradurre il "www" in indirizzo IP e a questo punto avremo la risposta definitiva. Il vostro server DNS quindi metterà in Cache questa corrispondenza di modo chè se voi riaprirete nuovamente lo stesso sito web vi fornirà direttamente la risposta senza fare tutti i passaggi di cui sopra.

    I Root Servers e la loro importanza:

    Ci sono 13 root server in tutto il mondo, 10 negli Stati Uniti, 2 in Europa (Londra e Stoccolma) ed uno a Tokio. Ecco la lista dei Root Server, con relativo indirizzo IP:

    A.ROOT-SERVERS.NET. IP=198.41.0.4
    B.ROOT-SERVERS.NET. IP=128.9.0.107
    C.ROOT-SERVERS.NET. IP=192.33.4.12
    D.ROOT-SERVERS.NET. IP=128.8.10.90
    E.ROOT-SERVERS.NET. IP=192.203.230.10
    F.ROOT-SERVERS.NET. IP=192.5.5.241
    G.ROOT-SERVERS.NET. IP=192.112.36.4
    H.ROOT-SERVERS.NET. IP=128.63.2.53
    I.ROOT-SERVERS.NET. IP=192.36.148.17
    J.ROOT-SERVERS.NET. IP=198.41.0.10
    K.ROOT-SERVERS.NET. IP=193.0.14.129
    L.ROOT-SERVERS.NET. IP=198.32.64.12
    M.ROOT-SERVERS.NET. IP=202.12.27.33

    Questi Servers ricoprono un ruolo di fondamentale importanza, per fare un esempio drastico, se questi server venissero spenti, nessuno potrebbe più navigare in Internet con una grave ricaduta sull'economia mondiale. Qualche mese fa infatti un particolare virus tentava attacchi continui a questi Root Servers mettendone in ginocchio alcuni. Ciò provocò un parziale blocco di Internet in alcune aree del globo. Nonostante siano Server ad altissime prestazioni, un eccessivo numero di richieste li può mettere in difficoltà.

    I 13 root servers vengono gestiti dall' ICANN, una società no-profit che controlla il sistema dei domain names, l'assegnazione degli indirizzi e l'intera organizzazione dei fornitori d'accesso alla rete.


    [Back to top]
Seleziona:
Vedi tutte le categorie
Visualizza e stampa