Volunia: a quick update

Volunia: a quick update

This i just a (very) quick update about my tests on Volunia: yesterday I focused on network activity and front end configuration, so that i’ve tried to focus today’s tests on search results and common gui errors.

The first thing i’ve noticed: searches are quickly improving. There are many more results, and Volunia’s team has reported that web indexing has been made quicker. In order to “measure” the index growth, i’ve decided to create a table and a graph where i’ll periodically report the number of results shown for some test words. I’ll speak about this in the next days. Well, don’t expect Google-level results in 2 days, but… It’s improving.

I’m a bit concerned about slowness. Searching for “I’m just trying to stress you” takes more that 8 seconds (and the sistem is not yet under heavy loads). But that’s not the worst point. Searching for those words, will lead to this results page:

Can you see that HTML encoding error?

Something similar happens if you search ” “Giorgio Bonfiglio” ” (yes, this time with the double quotes): Volunia will show only one result.

Now, let’s try to click on that “repeat the search with…” link. This is the result:

That’s terrible. It’s not just about an HTML encoding error: Volunia is showing results matching on… that error! Moreover, look at the third result: is Volunia really showing as third result a page where the only matching item is a first name?

Volunia for geeks

Volunia for geeks

No, you’re not drunk. This is my first english post: i planned to start writing in english a while ago but have never done that, as my audience is mainly italian. But i’ve decided to try and see what happens.

I’ve already written about Volunia, before and after trying it out. I plan to go deeper in details in the next few days, but now I want to show you some “geeky” things i’ve noticed in this search engine. I’m a sys/net admin, you know, so i couldn’t avoid opening WireShark to check what Volunia was doing and sending trough my computer (yes, this is the first time i’m really concerned about my privacy).

The first point: altough all POST data (profile and so on) is sent trough HTTPS to secure.volunia.com, the chat system (both public and private) is using Jabber trough HTTP (chat.volunia.com).

Searches too are using GET trough HTTP. This could be a concern, so I hope a full-HTTPS version will be released in the next months (they’re years that Google is available over HTTPS).

Second point: do you see something strange in the following screenshots (click on it to see a larger version)?

Have you noticed that “wp-content”? It’s the default WordPress directory to store themes and uploads! That’s… strange. Looks like it’s only used for their news page (http://en.volunia.com/news/), but i’m not sure: why leave the WP login page open to the world? It’s just matter of some .htaccess lines.

Hope WordPress is up-to-date, at least.

I decided to check active connections using “netstat” and this way I noticed that… The Volunia team doesn’t know what PTR records are. All their IP are still using the default Tiscali reverse records. Not a real concern, right, but a proper reverse dns records use makes netadmin’s work of monitoring their networks simplier. You can check what your users are connected to with a click, configure your firewalls to always accept outgoing traffic for hosts whose PTR ends in *volunia.com, and so on.

Anyway, this forced me to further study DNS records. I discovered that, while the main Volunia website (www.volunia.com) is behind Level3’s CDN, other services aren’t.

Both chat.volunia.com and secure.volunia.com are located in Italy. Is this only for testing purposes or is the system set to be used by the public this way?

Latency could be another concern, as I said in my first post: Italy is not the best place to put servers that need to be reachable all over the world. But, let’s look at NS records:

Do you see that? Those are default NameCheap (or Enom)’s DNS servers. Why not use an in-house solution or a more professional service, like dyn.com or Route 53? Everything but not lowcost services, please: Route53 is only $6 per year!

Some other random notes:

Received: from [127.0.1.1] (pitps004.volunia.net [172.27.38.204])
	by pitsrv03.volunia.net (8.13.8/8.13.8) with ESMTP id q19F4dJj031611
	for <GiorgioBonfiglio>; Thu, 9 Feb 2012 16:04:39 +0100

Ouch. I tought they were planning to grow and become a little bigger than 172.16.0.0/20 :(

I’m also wondering how many Power Users have been given access to Volunia as of today. Marchiori spoke about 100.000 PU, but, Volunia’s statistics tell a different story. How many users are using Volunia if only 200 are in the homepage?

Finally, I STRONGLY hope this “.NET” is just a “fake” header to prevent sites from blocking their bot and that Volunia is not Windows-based. Windows is killing big websites.

94.32.111.29 - - [09/Feb/2012:11:59:02 +0100] "GET /volunia.txt HTTP/1.0" 200 33 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.9.2.6) Gecko/20100625 Firefox/3.6.6 ( .NET CLR 3.5.30729)"

I’ve reported to Volunia’s team everything the WordPress thing and asked to properly set PTR records.

Giorgio

Volunia: Round 1

Volunia: Round 1

Esatto. Sono da poco stato “promosso” Power User di Volunia. Un (velocissimo) post con le mie prime impressioni per dare seguito a quello “alla cieca” di due giorni fa.

Ecco come si presenta l’homepage (click sull’immagine per vederla in grande):

Prima cosa che salta all’occhio di questa pagina? C’è gente che non sa la differenza tra Italiano ed Inglese. Perchè commentano in italiano nella versione in inglese. Io lo trovo fastidioso, mi ricordano i commenti in 18 lingue diverse delle fan 13enni ai post di Justin Bieber su Facebook. Proporrei, in questi casi, il ban prima dal sito, poi da internet (disattivazione ADSL) e, nel caso, dal Pianeta Terra.

Si nota già qualche problema con la mia risoluzione, ma sorvoliamo anche su questo perchè non sono un webdesigner (e ne vado fiero).

Dopo aver letto l’altro ieri l’articolo di Luca Conti (Pandemia.info) non mi meraviglio del fatto che cercando “Giorgio Bonfiglio” il primo risultato sia questo e il secondo risultato sia una pagina sul sito www.bonfiglioli.com che parla di Giorgio Napolitano.

Facendo la stessa ricerca su Google, per esempio, il primo risultato è il mio profilo Linkedin. Scartando il secondo ed il quinto che sono account Twitter e Facebook di miei omonimi, il terzo, il quarto, il sesto, il settimo e l’ottavo, sono, in ordine, i miei account Twitter e Facebook, il mio .tel, il mio profilo Google+ e questo blog.

Cerco il negozio di mia mamma. Si chiama “Cose di Carta”, ed ha sede a Nerviano (MI). Si, il nome lo rende abbastanza problematico per i motori di rierca, ma Yahoo, Google e addirittura Bing se la cavano alla grande. E poi, in fondo, il sito che voglio trovare è www.cosedicarta.com. Niente. Il primo risultato è www.di.fm. Secondo risultato, www.cose.org. Bandiera bianca.

La questione è anche “controversa”: in diverse interviste prima del lancio, Marchiori ha dichiarato chiaramente che il motore di ricerca semantico non fosse pronto, e fosse in programma per i prossimi mesi. Ma, dopo il lancio, nelle pagine Facebook ufficiali di Volunia (e nella stessa lettera di “Benvenuto” ai Power Users) il team ha iniziato a spiegare che l’indice web è “ridotto” per testare la struttura, e che la percentuale di internet indicizzata crescerà rapidamente. Un cambio di rotta? Che si siano accorti di quello che facevo notare nel mio primo post, ovvero che senza un indice completo non si andava proprio da nessuna parte?

Questo è stato il mio primo impatto con Volunia. Non il massimo, direi. Sconfortato dall’esperienza di ricerca, decido di dedicarmi al completamento del mio profilo. La pagina di gestione del profilo è carina, ordinata, divisa in tab, molto semplice.

Un solo problema: la grafica. La dimensione del testo, e quel tremendo bianco su blu elettrico, fanno davvero male agli occhi. Ho dovuto fare una pausa perchè proprio non ce la facevo.

E qui finisce il primo round.

L’idea per i prossimi giorni è quella di capirne un pò meglio il funzionamento, fare qualche test di velocità e capire quanto sia alla fine esteso questo indice. Se possibile, farmi qualche idea sulla struttura e su come è organizzato il sistema.

Giorgio

Ah, una piccola nota: non sono più abituato a battere invio dopo aver inserito le key di ricerca nel motore.

We speak IPv6!

We speak IPv6!

Inutile ricordare quanto sia importante la diffusione, immediata, di IPv6. Un modo per non restare indietro, per restare al passo con il mondo di internet che corre veloce (e, cresce). Un modo per evitare gli scenari apocalittici da esaurimento di indirizzi v4, un modo per non tornare al paleolitico: alle connessioni lente, ai siti irraggiungibili.

Quindi, da oggi (da qualche giorno in realtà, ma ero in fase di testing) grg.pw è raggiungibile anche in IPv6:

;; ANSWER SECTION:
grg.pw.        37216   IN      CNAME   tmp6.grg-web.eu.
tmp6.grg-web.eu.        17348   IN      A       205.185.117.144

;; ANSWER SECTION:
grg.pw.        37176   IN      CNAME   tmp6.grg-web.eu.
tmp6.grg-web.eu.        17308   IN      AAAA    2607:f358:1:fed5:5:0:484:1

Il supporto IPv6 è offerto nativamente da BuyVM (di cui avevo già parlato qui), provider presso il quale è ospitata la VPS su cui gira questo sito (credo passerò a qualcosa di più serio nei prossimi mesi, appena ne trovo il tempo, quasi sicuramente Linode).

Probabilmente, se volete connettervi al mio sito usando questo protocollo, dovete creare un tunnel “6in4” (hey, è gratis!). Ora come ora non ho guide pronte (potrei pensare di scriverne una), per cui vi rimando a GoGo6, ottima risorsa per chi decidesse di avvicinarsi a questo mondo (e anche per chi fosse costretto a farlo).

Ho testato tutto in tutti i modi possibili immaginabili (in dual stack è facile lasciare indietro qualcosa e non accorgersi degli errori), ma qualche svista può sempre esserci. Vi prego, nel caso in cui riscontraste errori o notaste qualcosa che non va, di contattarmi (rispondo sempre!). Al momento in cui scrivo manca il reverse DNS per l’indirizzo IPv6 (hmm, potrebbe esser problematico l’invio di email) e il setup DNS è ancora provvisorio (ho creato record temporanei per un veloce rollback in caso di problemi).

Anche Postfix (usato solo per le email in uscita dal blog, attualmente) è stato configurato per privilegiare le connessioni IPv6 rispetto alle v4. Molti sconsigliano questa pratica a causa dei problemi di connettività, io però ho voluto provare, pre rendermi conto. Terrò sotto stretto controllo i log. Fortunatamente, il traffico è minimo.

Il prossimo passo sarà rendere anche le mie mailbox (grg-web.eu e altri) compatibili con IPv6, ma questo è già più complesso, e non dipende completamente da me (le mailbox sono ospitate da Directi per ragioni di affidabilità e stabilità, e allo stato attuale delle cose non ci sono le premesse per tornare su una soluzione in-house). Stesso dicasi per i NameServer di grg-web.eu. Sono gestiti da Directi, e non accettano connessioni IPv6.

Una piccola nota: ieri pomeriggio mi sono messo alla ricerca di fornitori di webhosting con supporto IPv6, per pura curiosità, con risultati abbastanza imprevisti: i grandi, tra i quali Aruba, non sembrano conoscere minimamente questa nuova tecnologia. OVH offre supporto IPv6 solo sul “fronte” web (HTTP).

L’unico provider ad offrire supporto IPv6 (quasi) completo è, con immenso stupore (chi era cliente nel periodo di passaggio da PHP4 a PHP5 sa di cosa parlo) Tophost: oltre al lato web, rispondono in AAAA anche gli MX e i servizi SMTP e IMAP/POP. Il pannello di controllo, così come il sito aziendale, rimangono v4-only. Ho provveduto, considerata l’offerta in homepage, a comprare il dominio+hosting goingv6.eu. Anche se non so ancora cosa farci.

Se le politiche interne non sono cambiate da quando sono sparito io, uno dei prossimi ad arrivare nel mondo delle 4 “a” dovrebbe essere la mia amata Supernova SRL.

Vi aggiorno.

Giorgio

Volunia: un nuovo modo di cercare?

Volunia: un nuovo modo di cercare?

 

 

Oggi alle 12.00 ho guardato incuriosito la sua presentazione in diretta (chi non ce l’avesse fatta, può recuperarla qui, vale la pena dedicare un’ora di tempo alla sua visione). Volunia, insomma. Tutti oggi ne parlano, e io (ovviamente) sento il dovere di aggiungermi al coro. Preparatevi: sarà un lungo (interessante!) articolo/commento.

Premesso che, come al solito, non intendo dilungarmi con la parte informativa (per quella vi rimando all’articolo di Wired) spiego brevemente di cosa stiamo parlando. Volunia è un nuovo motore di ricerca, annunciato qualche mese fa come un qualcosa di innovativo, un motore che, a detta dei suoi creatori, avrebbe cambiato le nostre abitudini e il nostro stesso modo di concepire la ricerca online: questo video di presentazione dovrebbe rendere l’idea.

A dare credibilità al progetto il suo fondatore, il professor Massimo Marchiori dell’Università di Padova, ideatore della “HyperSearch“, che qualche tempo fa spiegava in questo video il suo nuovo progetto. HyperSearch, ovvero l’idea di “valutare” la pertinenza delle pagine considerando anche le relazioni tra queste, è riconosciuta come uno dei punti di partenza di Google e del suo algoritmo PageRank. Forse, se c’è una persona al mondo capace di rivoluzionare la ricerca online che conosciamo oggi, è proprio la persona che l’ha concepita.

Pochi i dettagli resi pubblici prima della presentazione di oggi (data di lancio della versione Beta su invito): solo un articolo sul Sole 24 Ore, questa domenica, aveva dato qualche (ristretta) anteprima.

Forte l’impronta italiana sul progetto: Volunia è un motore concepito da un italiano, a cui hanno lavorato e lavorano studenti ed ex studenti dell’Università di Padova, finanziato da un imprenditore italiano (Mariano Pireddu). I server su cui si basa il tutto, sono forniti dalla emiliana E4 Computer Engineering SPA e collocati presso il DC di Tiscali (in Sardegna). Una cosa che dovrebbe stupire in modo negativo, in un periodo in cui la tendenza è quella ad abbattere le distanze ed i confini fisici, ma che dovrebbe anche servire da spunto di riflessione a chi ormai non fa che parlare dell’Italia in modo pessimistico. Questo dimostra che se hai le capacità, le idee, i contatti, anche in Italia puoi trovare i finanziamenti.

Volunia in poche parole? Si tratta di WWW sociale, all’ennesima potenza. Il motore di ricerca non aiuta più solo nel trovare una determinata pagina, una risposta ad una domanda, ma ci informa anche sulle persone che la stanno visitando, ci aiuta nella ricerca considerando gli interessi delle persone a noi simili (i nostri “Amici”). Aggiunge insomma, ai contenuti le persone. Tra le altre cose,  offre la possibilità di cercare tra specifici tipi di contenuti nei siti web: con un click è possibile vedere tutti i contenuti multimediali di un determinato sito, tutti i documenti, e così via. Sempre corredati dell’informazione aggiuntiva: le persone che stanno visualizzando quegli “oggetti”, e quelle che li hanno visitati.

Devo confessare che la mia prima impressione non è stata molto positiva, ho pensato che non era niente di nuovo, niente che non avessi già visto: Google SideWiki mi permetteva di “commentare” le pagine web e di leggere cosa dicevano gli altri utenti come me, i vari box “I Like” / Google+ evidenziavano eventuali persone interessate agli stessi contenuti, e con un minimo di skills avrei potuto raggiungere gli stessi risultati della ricerca “per tipo di contenuto” con Google. L’idea di mappare un sito web come fosse una città, era un progetto (fallito, ovviamente), di Yahoo, 15 anni fa. E così via.

Poi però mi sono “svegliato”. Mi sono reso conto della novità, ho scoperto dove sta questa rivoluzione. Intendo, è tutto insieme: tutto in un unico strumento, in una unica finestra. Sono state aggregate decine di funzionalità sociali già presenti in rete, incentrandole sulla ricerca e sulla navigazione. L’ho detto io stesso poco fa: Volunia = SideWiki + I Like (Facebook) + Ricerca Avanzata (Google). Si, ma: un tool, uno strumento al posto di tre (e sarebbero molti di più, quei tre comprendono solo le funzionalità principali di Volunia).

Oggi inizia ufficialmente la fase Beta, e io sono più curioso che mai, più interessato di prima ad accedervi, ma mi rimane qualche perplessità, che elenco, servissero mai come “spunto” di discussione o riflessione:

  • Punto primo: si sente parlare continuamente dei “supercomputer” su cui si basa il sistema. Mi chiedo, terrorizzato: è un termine “fico” per la stampa e i giornalisti, un termine usato per semplificare le cose o davvero stiamo tornando a pensare a modelli di scalabilità verticale, forse più falliti delle mappe 3D di Yahoo?
  • Secondo: un progetto italiano, ho detto. Si, ok, ma siamo sicuri che, in vista di un lancio mondiale del motore, sia sensato avere tutti i server in Sardegna da Tiscali, sia in termini di latenza che di ridondanza?
  • Terzo: Google, come ricordato da Marchiori stesso nella presentazione, è un colosso. Un gigante, capace di schiacciare chiunque. Chi garantisce che non siano capaci di prendere quanto di buono c’è in Volunia, aggiungerlo a loro idee, a loro progetti e a quanto hanno già, al fine di lanciare un servizio simile in tempo zero?
  • Quarto, e ultimo punto: Marchiori stesso fa notare che attualmente Volunia non permette di effettuare ricerche nel web intero, ma solo in alcuni siti “importanti”. Non rischiamo che questo stronchi il progetto sul nascere? Nel senso: chi userebbe un motore di ricerca sapendo che non saranno inclusi tutti i risultati possibili? Non si corre il rischio, così facendo, di far crollare l’interesse verso il prodotto? Utenti (meglio: potenziali utenti) che non usano il servizio non perchè non interessati alle sue features, ma semplicemente perchè non permette, allo stato attuale, di avere una visione d’insieme del web.

Avevo qualche invito per beta aspiranti tester (“Power Users”) disponibile, ma li ho finiti. Potete comunque richiederne uno qui. Faccio notare che la fase beta, a quanto dicono, è solo un test “di carico” della struttura e pare non durerà più di tanto (1/2 settimane).

Leggo parecchi pareri contrari in rete, scritti da persone a cui è bastata la presentazione per perdere l’interesse in Volunia. Vorrei invitare ad analizzare le cose in modo più approfondito, a provare il prodotto, e, solo in seguito, ad esprimere pareri. Marchiori parlava di un cambio di prospettiva, e, a mio parere, proprio il fatto che ci troviamo davanti a persone che non comprendo l’utilità di un simile motore e a persone disorientate, è la migliore e più forte prova che questo cambio di prospettiva c’è stato davvero. Voleva lanciare qualcosa di davvero nuovo, e lo sta facendo.

E’ difficile prevedere quello che succederà nelle prossime settimane o mesi. Fermiamoci e assistiamo, attentamente.

Vi lascio, che è tardi. Posterò qualche aggiornamento/screenshot non appena (e, se) avrò accesso alla Beta.

Giorgio

Nota – Il logo l’ho preso da qui, non so bene con che licenza (è materiale per la stampa, che si possa usare più o meno liberamente?): spero nessuno mi uccida per questo, volevo solo fare un pò di pubblicità.