Un anno di estrazione di tag: la Macchina ce l’ha messa tutta, ma l’aiuto umano, sia detto senza vanagloria, le ha dato un bell’aiuto.

Ogni post che viene ripubblicato su Machinapost, viene analizzato dalla Macchina che estrae, a sua parere, le tag – entites, per usare il suo linguaggio – più significative per rappresentare le aree semantiche che connotano quel pezzo di contenuto. A volte ci chiappa, a volte meno, e qui le viene in aiuto l’algoritmo umano che – sia detto con tutta la modestia possibile – sarei io che mi rileggo l’intero post e controllo quanto siano appropriate le tag che sono state ricavate. Ora, è vero che il machine learning sta dando i suoi primi frutti e, pian piano, la Macchina sta imparando a riconoscere quali sono i dettagli di ogni post che più ci interessano, ma il contributo umano rimane ancora fondamentale.

Lo scopo principale dell’estrazione delle tag è quella di riuscire a dotare di un vocabolario comune – di un’ancora grezza ontologia, per usare i termini del web semantico – a tutti i blog, le webzine e le riviste online seguite da Machinapost. Lo scopo è quello di ordire progressivamente un tappeto di metadati comuni che permettano una navigazione trasversale tra i contenuti di piattaforme e autori/autrici diverse e che con opportune ricerche scovino corripondenze e affinità tra una molteplicità di creatori di contenuti.

Qui di seguito trovate un’infografica cone le 20 tag più usate in questo primo anno di vita online di Machinapost: non sto a commentarle adesso perché voglio farlo in una delle prime trasmissioni – audio o video che siano – che sono in preparazione e prossime al lancio.
——————————————————