PCTO: Progetti edizione 2022/2023


Esopianeti

Team

  • Iacopo Carini
  • Alessandro Morganti
  • Tommaso Silva
  • Matteo Soresi
  • Alessandro Zangrandi

Tutor DSE-Unimi: Michele Bartesaghi


Fumo e Salute


Team

  • Elena Ardenti
  • Sara Calamari
  • Luca Delfitto
  • Alessandro Mancioppi
  • Milena Taschieri

Tutor DSE-Unimi Simona Caruso


Cibo e Ambiente

Team

  • Sofia Bersani
  • Annalisa Braga
  • Matilde Magnani
  • Annalisa Rizzi

Tutor DSE-Unimi Alessia Leo Folliero


Musica nell'era di Spotify

Team

  • Giacomo Balordi
  • Alexandru Cater
  • Rebecca Chiesa
  • Alice Cigolini
  • Viola Ronzi

Tutor DSE-Unimi: Doina Vasilev


Chi sono gli influencer

Team

  • Elisa Ricetti
  • Federica Pipitone
  • Francesca Sartori
  • Gino Ragona
  • Matilda Turini

Tutor DSE-Unimi: Alessia di Giovanni

I dati permeano ogni aspetto della vita umana, anche se riguardanti oggetti da noi infinitamente lontani. Grazie ai dati è possibile "esplorare" luoghi e mondi in cui nessuno di noi avrà la fortuna di approdare fisicamente. Che cosa si può dire dei mondi che ci circondano, fuori dal nostro sistema solare? Ci sono esopianeti che hanno catturato l'attenzione, perché capaci di ospitare vita

Dopo aver appreso le nozioni astronomiche di base legate al concetto di esopianeta, sono stati scaricati e utilizzati diversi dataset dal sito della NASA. Sono state esaminate le diverse variabili, per capire quali informazioni fossero più rilevanti e comprendere in profondità i concetti con i quali ci si sta confrontando. Inoltre, sono state analizzate le modalità con le quali i dati sono stati riorganizzati e pubblicati. A seguito di una fase più esplorativa, è stato affrontato qualche aspetto più tecnico, ossia:

- I dati sono approssimazioni e stime, che vanno saputi interpretare. Chi li possiede non ha la verità assoluta (test di ipotesi sugli errori).

- Clustering e PCA: come raggruppare i pianeti con caratteristiche simili in modo automatico? Come rappresentare più variabili in un grafico bidimensionale?

Puoi trovare il nostro progetto su GitHub oppure puoi cliccare sul bottone qui a fianco.

Quello del fumo da sigaretta è un'abitudine che riguarda il 25% della popolazione italiana (dati EpiCentro 2020-2021), tuttavia questi dati non riguardano la popolazione di età inferiore ai 18 anni ed è per questo che è nata l'idea di diffondere una survey tra gli studenti del liceo Respighi per comprendere quanto sia diffusa l'abitudine di fumare sigarette e quali sono i fattori ad essa correlati. E' da notare che i risultati non possono essere generalizzati, in quanto il nostro è un campione selezionato in modo non casuale. 

E' stata condotta un'analisi per capire quali sono i motivi che spingono i ragazzi ad iniziare a fumare, quali sono le tipologie di sigarette maggiormente diffuse e se ci esistono delle differenze a livello socio-anagrafico tra i fumatori e i non fumatori. 

Infine è stato utilizzato un dataset medico per svolgere una regressione logistica e comprendere quali sono gli effetti del fumo da sigaretta sulla salute.

Puoi trovare il nostro progetto su GitHub oppure puoi cliccare il bottone qui a fianco.


La produzione alimentare ha un forte impatto sull'ambiente che si concretizza nell'impoverimento dei suoli e notevoli emissioni di C02 (circa un terzo delle emissioni globali). Si osserva inoltre, un massiccio consumo di acqua oltre che inquinamento e alterazione di alcuni habitat. 

Con il nostro progetto cerchiamo di evidenziare come e con quali cibi si possono fare scelte sostenibili che permettano di tutelare il benessere del pianeta e le risorse ambientali riducendo gli sprechi.

Abbiamo utilizzato dati che sono indicatori di kg di CO2 prodotta a seconda dell'alimento e del suo processo di produzione.

Il progetto si delinea in fasi successive: 

-analisi esplorativa del dataset selezionato mediante l'utilizzo di barplot e stacked barplot

-un analisi dei cluster mediante la tecnica k-means clustering e hierarchical clustering.

Puoi trovare il nostro progetto su GitHub oppure puoi cliccare sul bottone qui a fianco

Interagiamo con la "scienza dei dati" tutti i giorni. Dalle serie che guardiamo su Netflix, ai video che ci vengono raccomandati su Youtube, alle canzoni che ascoltiamo su Spotify. 

Per questo, abbiamo deciso di analizzare un dataset fornito dall'API di Spotify contente quasi 20 mila canzoni.

Nella nostra analisi abbiamo utilizzato una regressione lineare e una logistica per individuare le variabili che più contribuiscono alla popolarità di una canzone.

Infine, abbiamo creato due cluster in base alle differenti caratteristiche delle canzoni.

Puoi trovare il nostro progetto su Github oppure puoi cliccare sul bottone qui a fianco,

"Scrolling is the new smoking" hanno detto i The minimalists. Perché quindi non partire da ciò che si ha letteralmente sotto mano ogni giorno: Instagram.

Numero di followers, numero di posts, numero di likes, Instagram sembra essere il perfetto generatore di dati.

Noi li abbiamo sfruttati per condurre un'analisi univariata: abbiamo capito così chi è il più grande influencer, a che paesi appartengono il maggior numero di influencers e ancora a quali categorie, scoprendo che forse non è del tutto vero che è Instagram a far nascere gli influencers ma solo un mezzo per personaggi già famosi per diventarlo, sfruttando la piattaforma per una pubblicità più facile e veloce e per entrare a contatto con la propria community.

Grazie a un'analisi bivariata, abbiamo poi lavorato sulle variabili considerandole a coppie, confermando che questo social funziona: è, per esempio, vero che i più grandi influencers hanno anche il maggior numero di likes.

Scannerizza il qr code nell'immagine per vedere il profilo instagram dove abbiamo pubblicato la nostra analisi!

Puoi trovare il nostro progetto su GitHub oppure puoi cliccare sul bottone qui a fianco

© 2022 Data Science for Citizens. Tutti i diritti riservati.
Creato con Webnode Cookies
Crea il tuo sito web gratis! Questo sito è stato creato con Webnode. Crea il tuo sito gratuito oggi stesso! Inizia