Analisi dei post del 2021 di r/italy
Scritto il da Timendum
Per analizzare come è stato r/italy nel 2021 ho scaricato tutti i 6.455 post che ho trovato, salvati in csv e poi spippolati con Python. Per curiosità il primo è questo e l’ultimo è questo.
Si tratta di 6.455 post, di cui 3.008 (il 46%) post di testo (self) e il rimanente link, crosspost o altro.Solo 29 sono segnati come NSFW. Reddit riporta un totale di 1.254.494 (più di un milione) di commenti in questi post.
Il post medio riceve un punteggio di 187 e 194 commenti.
I top
I post più votati
Ecco i 5 post più votati del 2021:
Punteggio | Post | Autore |
---|---|---|
45.769 | Abbiamo vinto, mandiamo la nostra bandiera sulla frontpage!! | u/regian24 |
3.670 | Based on a fellow redditor’s photo from yesterday. ‘Etna is erupting’ 7x5” gouache. | u/bunkerbash |
3.327 | This Illustration, by a peruvian artist,of Italy as a Mario Level with landmarks is indredible | u/pakito6969 |
3.273 | Alcune cose non cambiano mai - Mancini e Vialli (2021 e 1986) | u/PonkiPonkiPoo |
2.988 | Ancient Romans compared to present-day Italians | u/_civilised |
I post più commentati
Ecco i post con più commenti:
Numero di commenti | Post | Autore |
---|---|---|
7.755 | [Megathread] Eurovision Song Contest 2021 - Serata Finale | u/Lord_TheJc |
5.438 | [Megathread] 71° Festival di Sanremo - Prima Serata | u/Jockbaia |
5.354 | [Megathread] 71° Festival di Sanremo - Terza Serata (Cover/Duetti) | u/Jockbaia |
4.919 | [MEGATHREAD] Finale EURO 2020 Italia - Inghilterra | u/nerdvana89 |
3.336 | [Megathread] Semifinale EURO 2020 - Italia - Spagna | u/nerdvana89 |
3.157 | [Megathread] 71° Festival di Sanremo - Seconda Serata | u/Jockbaia |
3.003 | Megathread Coronavirus * 19/07/21 - 25/07/21 | u/Lyrtil |
2.899 | Megathread Coronavirus * 08/03/21 - 14/03/21 | u/Lyrtil |
2.566 | Megathread Coronavirus * 19/04/21 - 25/04/21 | u/Lyrtil |
2.359 | Caffè Italia * 04/10/21 | u/RedditItalyBot |
Escludendo Caffè, megathread e simili, troviamo:
Numero di commenti | Post | Autore |
---|---|---|
1.999 | Il thread delle opinioni impopolari | u/nan |
1.852 | DRAGHI 🀄 | u/MyPendrive |
1.515 | AskRagazze: tutto quello che avreste voluto sapere sulle donne (ma non avete mai osato chiedere) | u/nan |
1.490 | Opinioni impopolari sulla musica italiana | u/Ancient_Badger5777 |
1.419 | No stupid questions r/Italy edition | u/nerdvana89 |
1.270 | Parole / espressioni comuni che odiate sentire senza un motivo preciso | u/nan |
I post più premiati
Ecco i post che invece hanno ricevuto più premi (compresi quelli gratuiti):
Numero di premi | Numero di Gold | Post | Autore |
---|---|---|---|
589 | 2 | Abbiamo vinto, mandiamo la nostra bandiera sulla frontpage!! | u/regian24 |
107 | 1 | BEST BRAU MASTERRACE: la recensione di tutte (o quasi ) le birre dell’eurospin | u/shepard281 |
95 | 1 | Ho abortito e non me ne pento. | u/neroina |
77 | 1 | [FantaCalcio] Statistiche Asta 2021 | u/hamlet84 |
74 | 1 | Dopo 13 anni come sviluppatori software io e il mio collega ci siamo dimessi e abbiamo investito tutto nel fondare un’azienda di videogiochi. Ieri abbiamo rilasciato Medievalien, un gioco in cui degli Alieni arrivano in un mondo fantasy Medievale. Chiedeteci pure qualunque cosa! | u/b4gn0 |
Gli autori più attivi
In un grafico i 10 utenti che postano di più su r/italy.
Da soli fanno il 10% dei post e il 9% del karma.
I post perfetti
Per ogni post, Reddit riporta anche la percentuale di voti positivi (upvote) rispetto ai negativi (downvote), ci sono alcuni post con (immagino approssimativamente) 100% di upvote, eccoli:
Una “foto” di tutti i post
Ecco un grafico con tutti i post del 2021, esclusi Caffè, Megathread (San Remo, Eurovision, etc inclusi).
I grafici cumulativi
I post suddivisi per punteggio
Sperando in una rappresentazione più chiara, ho rappresentato sul grafico successivo quanti post (sulle y, in scala logaritmica) hanno terminato con quel punteggio (sulle x).
I post suddivisi per numero di commenti
Come prima, ma contando il numero di commenti finale.
Approfondimenti
Analisi per ora di invio
Ho poi rappresentato su un grafico quanti post (sulle y) vengono inviati in ogni ora del giorno. (Escluso il top post). Il colore del pallino rappresenta il punteggio medio dei post in quell’ora. Ne deduciamo quindi che i post inviati tra le 7 e le 10 del mattino sono leggermente meglio votati.
Analisi per giorno di invio
Come sopra, ma suddivisi per giorno al posto che per ora.
La destinazione dei post
Sul grafico successivo trovate i post suddivisi per dominio, cioè su che sito ti porta il link (se presente), in percentuale sul totale.Il numero sopra la barra corrisponde al punteggio medio del post di quella categoria.
Ad esempio abbiamo avuto 285 post verso ilpost.it (il 4.4% dei post), per un totale di 50.515 karma (il 4.3% del karma totale), con una media di 177 karma per post.
Considerazione personale: i self sono quelli più presenti ma anche più vari, ce ne sono di tutti i tipi e con risultati diversi. Immagini (reddit.com e imgur) non sono così presenti ma sono molto votati, il triplo degli altri (perché sono un contenuto facile?); ilpost NON è la fonte principale, né per numero di post né per voti (totali o medi).
Andamento nell’anno
Numero di commenti
Ho voluto rappresentare mediamente quanti commenti hanno ricevuto i post (esclusi caffè, megathread, …) nel corso dell’anno. In arancione una regressione polinomiale di 2o grado, cioè una curva che dovrebbe rappresentare il macro-andamento nell’anno.
Punteggio
Come sopra, ma con il punteggio finale dei post.Qui la regressione è di 8o grado perché il trend è molto più ondulatorio, con un enorme picco a luglio/agosto.
Come ho fatto?
Ho scaricato i dati aggiornati dei post con PRAW, salvati in un csv, quindi analizzati in Python, su un notebook Jupyter, grazie a pandas, numpy, scipy; i grafici sono fatti con matplotlib.
Il codice è su gist.
Un grazie a u/dhc21 per la revisione dei contenuti.