Un anno di post e commenti su r/italy analizzati

Riprendo una mia vecchia tradizione: le analisi di /r/italy.

Anche questo giro cercato di rappresentare in grafici e classifiche un anno di contenuti di /r/italy, dal 10 settembre 2022 al 10 settembre 2023.

Perimetro

L’analisi include tutti i post tra caffè del 10 settembre 2022 e questo post compresi, si tratta di 4.147 post in totale. Degli stessi post, ho preso i commenti inviati: sono 960.419.

Probabilmente mi è sfuggito qualcosa, non sono stato a controllare a mano. In linea generale sono esclusi i contenuti rimossi, mentre quelli cancellati potrebbero essere inclusi, ma dipende da quando il contenuto è diventato non disponibile.

Ci sono solo 10 post segnati come NSFW.

I post

I Voti

Il voto medio è 151, la mediana è 84, in effetti la deviazione standard è di 212, molto alta, più alta della media. Per capirci:

  • Il 15% dei post (3.544) è a 10 voti o meno
  • Il 25% dei post (3.126) è a 22 voti o meno
  • Il 38% dei post (2.573) è a 50 voti o meno
  • Il 50% dei post (2.573) è a 84 voti o meno
  • Il 54% dei post (1.889) è a 100 voti o meno
  • Il 75% dei post (1.036) è a 199 voti o meno

Nota: Il voto non è mai definitivo per Reddit, chiunque può entrare anche dopo un anno e dare voto su o giù.

La top 10

Ecco i 10 post più votati:

Score Post Autore
3,210 This went up near our Airbnb in Rome. Can anyone explain? u/Hell_Rey99
2,715 Sareste contro la possibilità di guadagnare segnalando auto che bloccano marciapiedi e piste ciclabili? u/hondufitta
2,506 Zerocalcare e i virgolettati inventati che gli sono stati attribuiti dai giornalisti italiani u/PreviouslyMannara
2,338 Il social manager del corriere ha avuto una mattinata difficile: Il nome prima di ogni tweet è l’account dal quale sarebbe dovuto partire il tweet stesso. u/kinski80
2,308 Ciao! I’m an Australian artist currently living in beautiful Lecce. Here are my first four oil paintings of the amazing Baroque architecture here. I hope you like them 😊 u/hazzlaw
1,857 Arrestato il boss superlatitante Matteo Messina Denaro. Era ricercato da 30 anni u/Ilnormanno
1,791 First time in Rome and my hotel have this. Was that for the feet? u/26fm65
1,752 Nuova direttiva europea sulla trasparenza salariale: salario nell’annuncio o prima del primo colloquio, divieto di chiedere la storia salariale ai candidati, obbligo di fornire ai lavoratori il dato sul salario medio della loro posizione u/DurangoGango
1,705 Attraverso calcoli complessi, u/DrLimp dimostrò il motivo per il quale alcune persone preferiscono il pandoro nonostante l’ovvia superiorità del Panettone. u/nicosemp
1,703 Il 25 Aprile non è divisivo. Il 25 Aprile è la festa della Libertà contro ogni forma di repressione dittatoriale e antidemocratica. u/Lilac_Spring

Perfetti

Per ogni post, Reddit riporta anche la percentuale di voti positivi (upvote) rispetto ai negativi (downvote), ci sono alcuni post con (immagino approssimativamente) 100% di upvote, ecco quelli con almeno 100 voti:

Punteggio Post Autore
413 Cookie wall dei vari siti di informazione italiani: il Garante privacy sta indagando sulle iniziative degli editori u/giuliomagnifico
390 Antitrust sanziona Vodafone, Wind, Telecom e Fastweb - Per fatturazioni post recesso, multa da un milione totale u/DurangoGango
324 Vi ricordate il post sulle finte agenzie immobiliari? La situazione sta sfuggendo di mano e ora le finte agenzie stanno “comprando” le vere agenzie immobiliari. State attenti a SoloAffitti. u/YahyaJ
275 Manovra: la ragioneria di stato ha chiesto lo stralciamento della norma che stanzia 450 milioni per i Comuni, sarebbe priva di copertura. Inoltre fa rilievi su 44 emendamenti che dovranno essere corretti in gran parte sempre per problemi di coperture u/giuliomagnifico
248 Bartolini e Geodis in amministrazione giudiziaria: accuse di sfruttamento della manodopera delle cooperative, frode contabile e fiscale, mazzette per il CEO Manti u/DurangoGango
217 Esondato il fiume Misa: si contano morti e dispersi u/LaReineBlanche__
212 Editoria, il 30 per cento dei libri non vende nemmeno una copia u/MicheleCaracas
204 Il Tribunale dell’Unione Europea ha confermato una multa da oltre 4 miliardi di euro inflitta a Google per aver violato le regole sulla concorrenza u/Sunnyboy_18
182 Mondialpol, commissariata per caporalato e sfruttamento dei lavoratori, alza gli stipendi fino al 38% e la Procura revoca il commissariamento u/giuliomagnifico
158 9 Maggio 1946: Vittorio Emanuele III abdica alla Corona del Regno d’Italia in favore del figlio Umberto e parte in esilio volontario per l’Egitto u/Cold-Voice5839
117 Dal 2015, la Sicilia ha rimandato 15 volte le elezioni per istituire le Città metropolitane: interviene direttamente la Corte costituzionale u/Mirieste

Gli autori

Ci sono stati 1.844 utenti diversi che hanno fatto un post:

  • 1.421 utenti, il 77%, hanno pubblicato 1 solo post
  • 106 utenti (6%) hanno pubblicato 5 post o più
  • 20 utenti (1%) hanno pubblicato 19 post o più

Vediamo ora chi invia più post. Ho preso in considerazione i top 13 poster, per numero di post; insieme totalizzano 698 submission, poco meno del 17%.

Sommando il punteggio dei loro post, arriviamo a 115.014 karma (su 629.850), poco più del 18%, quindi i loro post vanno mediamente leggermente meglio degli altri.

Di seguito i 10 autori più prolifici in un grafico: sulle X (in orizzontale) il numero dei post, sulle Y il karma totale accumulato con i post.

Nota: ho escluso solo il “Caffè”, ma non i “Casual” da questa analisi.

I domini

Passiamo ora ai siti più condivisi e votati su Reddit. Un dominio è il “sito” su cui ti porta il link (se presente).

Nota: ho cercato di normalizzare i domini il più possibile, per convertire i link youtu.be in youtube.com per esempio. Come negli altri casi, qualcosa potrebbe essermi sfuggito.

Due chiarimenti:

  • self.italy sono tutti i post testuali
  • reddit.com fa riferimento soprattutto ai post di immagini o video, ma anche ai crosspost interni

Ci sono stati 344 diversi domini fonte dei post:

  • Il 235 domini (il 68%) hanno solo 1 post
  • Il 41 domini (12%) hanno almeno 5 post
  • Il 23 domini (7%) hanno almeno 10 post
  • Il 18 domini (5%) hanno almeno 15 post

Sul grafico successivo trovate i post suddivisi per dominio, in percentuale sul totale. Il numero sopra la barra corrisponde al punteggio medio del post di quella categoria.Occhio che le scale sono in percentuale.

Ad esempio abbiamo avuto 243 post verso ilpost.it (quasi il 6% dei post), per un totale di 44.656 karma (il 7% del karma di tutti i post), con una media di 184 karma per post.

Considerazione personale: i self sono quelli più presenti ma anche più vari, ce ne sono di tutti i tipi e con risultati diversi.
Le immagini e simili (reddit.com) non sono così presenti ma sono molto votati, il triplo degli altri (perché sono un contenuto facile, accessibile senza leggere né cliccare).
Il Post è diventato la fonte principale, anche se la media voto non è tra le migliori, probabilmente una fonte troppo abusata.

Gli orari

Ora vediamo quanto l’ora del giorno in cui un post viene inviato influenza il voto finale.
L’altezza nel grafico indica quanti post; il colore del pallino rappresenta il punteggio medio dei post in quell’ora.

Ne deduciamo quindi che i post inviati la mattina, dalle 8 fino all’ora di pranzo, sono leggermente meglio votati (media sopra i 170).

Giorno della settimana

Discorso simile, ma guardiamo il giorno della settimana.
Occhio, il colore non parte da “zero” quindi le differenze sono più accentuate rispetto al grafico precedente.

Risultato: la domenica i post vanno leggermente meglio (media sopra i 180).

Andamento nell’anno

Ho rappresentano in grafico quanti post sono stati creati su r/italy nel corso dell’anno.
Per evitare un grafico troppo frastagliato, dovuto alle naturali micro variazioni di un giorno con l’altro, nel grafico c’è una media del numero dei post sui 14 giorni.

Che è successo prima di Luglio? Lo “sciopero”.

Commenti

Da queste analisi ho escluso RedditItalyBot e altri account di moderazione.

La top 12

Ecco i 12 post con più commenti, sono arrivato a 11 per includere il primo Caffè.

Num commenti Post Autore
8,063 [Megathread] 73° Festival di Sanremo - Quinta Serata (FINALE) u/Jockbaia
6,536 [Megathread] 73° Festival di Sanremo - Quarta Serata (DUETTI) u/Jockbaia
6,409 Iscriviti al Fantamorto edizione 2023! u/fantamortobot
6,262 [Megathread] 73° Festival di Sanremo - Prima Serata u/Jockbaia
5,495 [Megathread] 73° Festival di Sanremo - Seconda Serata u/Jockbaia
5,391 [Megathread] 73° Festival di Sanremo - Terza Serata u/Jockbaia
3,664 [Megathread] Elezioni Politiche 2022 - Spoglio e risultati - II u/listello
3,558 [Megathread] Eurovision Song Contest 2023 - Serata FINALE u/Modena89
2,852 [Megathread] Elezioni Politiche 2022 - Spoglio e risultati u/listello
2,422 [Megathread] Elezioni Politiche 2022 - Anteprima u/listello
1,708 Caffè Italia * 28/09/22 u/RedditItalyBot

Invece escludendo i Caffè, i Megathread e simili, ecco la top 7:

Num commenti Post Autore
1,671 Stavo camminando e ho trovato un auto con una ruota a terra e con questo messaggio sul parabrezza. u/ActuallyNotSoBright
1,209 Ma voi ci andreste in guerra? u/fruzziy
1,080 Sgonfiano le ruote ai suv a Milano, blitz collettivo suv-versive - Cronaca u/zborro
1,020 Qual è la spesa “sostanziosa” di cui vi siete maggiormente pentiti? u/Khronos91
856 (crosspost) Avete visto delle 3 ragazze in treno accusate di “razzismo” che sta facendo il giro del mondo? u/Kooky_General_3292
852 Cose che “come ho fatto a stare senza?” u/catf1shed
848 Un aggiornamento sul Blackout, vogliamo sentire la vostra opinione u/timendum

Gli estremi

I commenti più votati:

Punteggio Commento Autore
2537 Copypasta Pavarotti’s Nessun Dorma u/La-Sborrata-Sul-Viso
2392 come triggerare 60milioni di persone sul bidet u/rusl1
1721 Rant su Minecraft o una complessa analisi geopolitica? u/Ilgiovineitaliano
1552 Americani che fotografano edifici a caso u/emAK47
1443 Sui commenti del corriere fatti da puppet u/RMattiae

Il peggiore? Questo rant su come gli utenti di questa comunità trattano Elon Musk.Per favore non fate altri downvote, quello è brigading ed è contro le regole di Reddit.

Gli autori

Ho registrato 30,096 utenti che hanno scritto almeno un commento:

  • 19,902 utenti (il 32%) hanno più di 1 commento
  • 12,083 utenti (il 40%) hanno 5 commento o più
  • 8,233 utenti (il 27%) hanno 10 commento o più
  • 5,463 utenti (il 18%) hanno 20 commento o più

Ora passiamo ai più attivi. I primi 19 commentatori, per numero di contenuti, totalizzano 83,843 commenti (sui 960,419 totali), quasi il 9% del totale!.

Sommando il punteggio dei loro post, arriviamo a 329,338 karma (su 6,467,218), poco più del 5%.

Di seguito gli stessi autori un grafico: sulle X (in orizzontale) il numero dei commenti, sulle Y il karma totale accumulato con essi.

Stessa analisi, grafico diverso. In rosso la barra che conta quanti commenti un utente ha inviato, in blu il karma accumulato. Il numero sopra le barre indica il karma medio dei commenti dell’utente.
Quale è più chiaro? Questo o il precedente?

Voti e commenti

Questa è invece una vista aggregata, una “foto” di tutti i post analizzati, occhio che la scala è logaritmica!

I Caffè sono quasi tutti in un’area quasi solo per loro, con pochi voti (decine) e molti commenti (migliaia).

Sfide tra parole

Qui ho preso alcune parole e ho cercato quanto spesso apparissero nei commenti e in che periodo dell’anno.
I grafici rappresentano quanti commenti ci sono stati, per settimana, contenente la parola.

Panettone vs Pandoro

Un classico di r/italy.

Riassumo:

  • Panettone: 4.335 commenti, 295 karma totale, 14.7 karma medio
  • Pandoro: 3.370 commenti, 213 karma totale, 15.8 karma medio

Politica

I protagonisti dell’ultimo anno a cui ho pensato sono Meloni, Salvini e Schlein, quindi eccoli:

Riassunto:

  • Meloni: 53,905 commenti, 2,713 karma totale, 19.8 karma medio
  • Salvini: 37,447 commenti, 1,788 karma totale, 20.9 karma medio
  • Schlein: 8,295 commenti, 547 karma totale, 15.1 karma medio

Medio oriente

Anche se il tema è diventato caldo dopo la fine di questa analisi, ho voluto comunque confrontare:

  • Israele: 8,056 commenti, 560 karma totale, 14 è il karma medio
  • Palestina: 3.145 commenti, 235 karma totale, 13 è il karma medio

Analisi ulteriori

I post suddivisi per punteggio

Sperando sia una rappresentazione chiara, ho rappresentato sul grafico successivo logaritmico quanti post (sulle y, in scala logaritmica) hanno terminato con quel punteggio (sulle x).

È una bella curva che mi sembra omogenea, senza grossi gradini.

I post suddivisi per numero di commenti

Simile, ma questa volta per il numero di commenti.

Qui invece si vede bene come ci sia un numero alto di post con pochi commenti, poi un gruppo più fitto di circa 1000 post con centinaia di commenti ed infine qualche decina di post con migliaia di commenti.

Come ho fatto?

Ho scaricato i dati dei post con PRAW e li ho salvati in un database sqlite. Quindi li ho analizzati in Python, su un notebook Jupyter, grazie a pandas, numpy; i grafici sono fatti con matplotlib.

Il codice è su gist.


Grazie a SpigoloTondo per la correzione.