Vad kan forskare hitta bland de 32 miljoner webbadresser som Facebook just släppt till Social Science One?

Faktakontroll

Av Sergey Nivens/Shutterstock

Samhällsvetenskap ett , den ideella kommission som lanserades 2018 för att etablera konkreta partnerskap mellan akademiker och datarika institutioner som Facebook, har nu 32 miljoner individuella länkar extraherade från Mark Zuckerbergs sociala medienätverk som man kan göra forskning på.

Efter en oväntad försening på nästan ett år, något som skapade en upprörd med projektets grundare fick koalitionen av forskare äntligen från Facebook vad som anses vara 'en av de största uppsättningen länkar någonsin skapat för akademisk forskning.”

Det är åtminstone vad Solomon Messing, tidigare chef vid Pew Researcher Centers Data Lab och nu chef för datavetenskap för Social Science One, berättade för IFCN.

Nu kommer team av forskare utvalda från hela världen att kunna använda datasetet för att identifiera trender, mönster och populära ämnen inom innehållsvärlden på Facebook.

Enligt plattformen inkluderar datamängden antalet gånger webbadresserna delades offentligt, datumet de delades första gången, datumet då de först faktakontrollerades, landet där de delades mest och en sammanfattning av det faktiska innehållet som finns i URL:en.

Den innehåller också data om användarinteraktion, inklusive antalet gånger en URL flaggades av en användare som innehållande falska nyheter och antalet gånger en URL delades utan att verkligen klickas på.

Facebook sa att de valde dessa datapunkter eftersom de allmänt anses vara indikatorer på desinformation. Från och med nu kan forskare använda dem för att förstå vilken typ av ämnen som dominerar på plattformen eller för att skapa maskininlärningsmodeller baserade på dessa mönster.

För att komma åt uppsättningen med cirka 32 miljoner webbadresser måste akademiker få sina projekt godkända av Social Science One-kommissionen. Förslag som antas kan tilldelas finansiering, data och andra förmåner. Och alla resultat kan publiceras enligt forskarens önskemål, utan några ytterligare begränsningar från Facebook eller kommissionen.

'Vi fortsätter att göra ytterligare data tillgänglig på ett sätt som skyddar människors integritet', säger Messing. 'Denna datamängd kommer att tillåta forskare att svara på viktiga frågor om desinformation och sociala mediers roll i samhället.'

Förväntningarna är höga.

En försening i dataleveransen

I april 2018, då Facebook meddelat det samarbetade med akademiker för att förse dem med värdefull data för desinformationsforskning, det förväntades att dessa datauppsättningar skulle ta lite tid att förbereda. Men inte så länge.

I augusti, Buzzfeed News rapporterad att Social Science Ones finansiärer, inklusive Democracy Fund, William and Flora Hewlett Foundation, John S. och James L. Knight Foundation, Charles Koch Foundation och Omidyar Network hotade att dra sig ur projektet på grund av förseningen.

Enligt rapporten gav de Facebook en deadline till den 30 september för att dela de datamängder som de hade lovat, annars skulle projektet avslutas.

I januari hade Social Science One dock meddelat i ett blogginlägg att Facebook skulle behöva mer tid för att släppa en URL-datauppsättning med hänvisning till integritetsproblem.

'Facebook måste inte bara följa EU:s nya allmänna dataskyddsförordning, såväl som liknande integritetslagar i jurisdiktioner runt om i världen, utan det måste också följa Facebooks samtyckesdekret med U.S.F. Federal Trade Commission,' blogginlägg läsa. 'På grund av vårt projekts oöverträffade karaktär, går Facebook långsamt och försiktigt för att säkerställa att vårt projekt följer alla relevanta juridiska riktlinjer.'

Datauppsättningen släpptes i mitten av september, strax före den deadline som Buzzfeed rapporterade.

Hur hanterades integritetsproblem?

Enligt Facebook lades differentiell integritet till webbadresserna som kom in i datasetet. Detta innebär att varje individs bidrag till uppgifterna har maskerats.

Facebook sa att det karakteriserade differentiell integritet som ytterligare 'statistiskt brus' som ger människor ett extra lager av skydd och håller dem säkra från cyberattacker.

Vilken forskning görs möjlig av denna datauppsättning?

En tidigare version av URL-datauppsättningen, som gjordes tillgänglig för godkända forskare via den sociala övervakningsplattformen CrowdTangle, användes redan i en studie om samordnat oäkta länkdelningsbeteende inför valet till Europaparlamentet 2019 i Italien.

Nu kommer forskare att kunna använda hela datasetet för att bättre förstå vilka typer av innehåll och ämnen som är vanliga på Facebook. De kommer att kunna identifiera mönster i vad som delas över tid och kan potentiellt bygga maskininlärningsmodeller som upptäcker felaktig information.

Facebook sa att forskare länge har varit medvetna om behovet av en stor och mångsidig datauppsättning för att träna en sådan maskininlärningsmodell. Denna URL-datauppsättning är bland de största som finns, på 7 gigabyte och innehåller cirka 32 miljoner webbadresser och cirka 544 miljoner cellvärden.

Akademiker kanske kan identifiera hur trendrikt innehåll är relaterat till politiska evenemang och produktlanseringar på Facebook. Andra potentiella studieämnen inkluderar hur polarisering, politiker och nyhetscykler spelar en roll i spridningen av desinformation på plattformen.

Ta Reda På Kompatibilitet Med Stjärntecken

Vad kan forskare hitta bland de 32 miljoner webbadresser som Facebook just släppt till Social Science One?

Faktakontroll