Pwy sy'n casglu data mawr a pham?

Yng nghwymp 2019, fe ffrwydrodd sgandal gyda gwasanaeth Apple Card: wrth gofrestru, cyhoeddodd derfynau credyd gwahanol ar gyfer dynion a menywod. Roedd hyd yn oed Steve Wozniak allan o lwc:

Flwyddyn yn gynharach, datgelwyd bod platfform Netflix yn dangos gwahanol bosteri a rhagbrofion i ddefnyddwyr, yn dibynnu ar eu rhyw, oedran a chenedligrwydd. Am hyn, cyhuddwyd y gwasanaeth o hiliaeth.

Yn olaf, mae Mark Zuckerberg yn cael ei geryddu'n rheolaidd am honnir iddo gasglu, gwerthu a thrin data ei ddefnyddwyr gan Facebook. Dros y blynyddoedd, cafodd ei gyhuddo a hyd yn oed geisio ei drin yn ystod etholiadau America, gan gynorthwyo gwasanaethau arbennig Rwseg, ysgogi casineb a safbwyntiau radical, hysbysebu amhriodol, gollwng data defnyddwyr, rhwystro ymchwiliadau yn erbyn pedoffiliaid.

Post Facebook gan zuck

Ar yr un pryd, mae gwasanaeth ar-lein Pornhub yn cyhoeddi adroddiadau yn flynyddol ar ba fath o pornograffi o wahanol genhedloedd, rhyw ac oedran y mae'n chwilio amdano. Ac am ryw reswm nid yw hyn yn poeni neb. Er bod yr holl straeon hyn yn debyg: ym mhob un ohonynt rydym yn delio â data mawr, a elwir yn "olew newydd" yn y ganrif XNUMXst.

Beth yw data mawr

Mae data mawr – maent hefyd yn ddata mawr (eng. Data Mawr) neu fetadata – yn amrywiaeth o ddata sy’n cyrraedd yn rheolaidd ac mewn niferoedd mawr. Cânt eu casglu, eu prosesu a'u dadansoddi, gan arwain at fodelau a phatrymau clir.

Enghraifft drawiadol yw'r data o'r Peiriant Gwrthdaro Hadron Mawr, sy'n dod i mewn yn barhaus ac mewn symiau mawr. Gyda'u cymorth, mae gwyddonwyr yn datrys llawer o broblemau.

Ond nid ystadegau ar gyfer ymchwil wyddonol yn unig yw data mawr ar y we. Gellir eu defnyddio i olrhain sut mae defnyddwyr o wahanol grwpiau a chenhedloedd yn ymddwyn, beth maen nhw'n talu sylw iddo a sut maen nhw'n rhyngweithio â chynnwys. Weithiau, ar gyfer hyn, cesglir data nid o un ffynhonnell, ond o sawl ffynhonnell, gan gymharu a nodi patrymau penodol.

Ynglŷn â pha mor bwysig yw data mawr ar y rhwydwaith, dechreuon nhw siarad pan oedd llawer ohono mewn gwirionedd. Ar ddechrau 2020, roedd 4,5 biliwn o ddefnyddwyr Rhyngrwyd yn y byd, ac roedd 3,8 biliwn ohonynt wedi'u cofrestru mewn rhwydweithiau cymdeithasol.

Pwy sydd â mynediad i Ddata Mawr

Yn ôl arolygon, mae mwy na hanner ein gwledydd yn credu bod eu data ar y rhwydwaith yn cael ei ddefnyddio gan drydydd partïon. Ar yr un pryd, mae llawer yn postio gwybodaeth bersonol, lluniau, a hyd yn oed rhif ffôn ar rwydweithiau cymdeithasol a chymwysiadau.

Pwy sy'n casglu data mawr a pham?
Pwy sy'n casglu data mawr a pham?
Pwy sy'n casglu data mawr a pham?
Pwy sy'n casglu data mawr a pham?

Mae angen ei esbonio yma: y person cyntaf yw'r defnyddiwr ei hun, sy'n gosod ei ddata ar unrhyw adnodd neu raglen. Ar yr un pryd, mae'n cytuno (yn rhoi tic yn y cytundeb) i brosesu'r data hwn ail barti – hynny yw, perchnogion yr adnodd. Trydydd parti yw'r rhai y gall perchnogion yr adnodd drosglwyddo neu werthu data defnyddwyr iddynt. Yn aml mae hyn yn cael ei ysgrifennu yn y cytundeb defnyddiwr, ond nid bob amser.

Y trydydd parti yw asiantaethau'r llywodraeth, hacwyr neu gwmnïau sy'n prynu data at ddibenion masnachol. Gall y cyntaf gael data trwy benderfyniad llys neu awdurdod uwch. Wrth gwrs, nid yw hacwyr yn defnyddio unrhyw ganiatâd - yn syml, maent yn hacio'r cronfeydd data sydd wedi'u storio ar y gweinyddwyr. Gall cwmnïau (yn ôl y gyfraith) gael mynediad at ddata dim ond os ydych chi eich hun wedi caniatáu iddynt – drwy dicio’r blwch o dan y cytundeb. Fel arall, mae'n anghyfreithlon.

Pam mae cwmnïau'n defnyddio Data Mawr?

Mae data mawr yn y maes masnachol wedi cael ei ddefnyddio ers degawdau, nid oedd mor ddwys ag y mae ar hyn o bryd. Mae'r rhain, er enghraifft, yn gofnodion o gamerâu gwyliadwriaeth, data gan lywiwr GPS neu daliadau ar-lein. Nawr, gyda datblygiad rhwydweithiau cymdeithasol, gwasanaethau ar-lein a chymwysiadau, gellir cysylltu hyn i gyd a chael y darlun mwyaf cyflawn: ble mae darpar gwsmeriaid yn byw, beth maen nhw'n hoffi ei wylio, ble maen nhw'n mynd ar wyliau a pha frand o gar sydd ganddyn nhw.

O'r enghreifftiau uchod, mae'n amlwg, gyda chymorth data mawr, bod cwmnïau, yn gyntaf oll, eisiau targedu hysbysebion. Hynny yw, cynnig cynhyrchion, gwasanaethau neu opsiynau unigol yn unig i'r gynulleidfa gywir a hyd yn oed addasu'r cynnyrch ar gyfer defnyddiwr penodol. Yn ogystal, mae hysbysebu ar Facebook a llwyfannau mawr eraill yn dod yn fwyfwy drud, ac nid yw ei ddangos i bawb yn olynol yn broffidiol o gwbl.

Defnyddir gwybodaeth am ddarpar gwsmeriaid o ffynonellau agored yn weithredol gan gwmnïau yswiriant, clinigau preifat a chyflogwyr. Gall y cyntaf, er enghraifft, newid telerau yswiriant os ydynt yn gweld eich bod yn aml yn chwilio am wybodaeth am glefydau neu feddyginiaethau penodol, a gall cyflogwyr asesu a ydych yn dueddol o wrthdaro ac ymddygiad gwrthgymdeithasol.

Ond mae yna dasg bwysig arall sydd wedi bod yn ei chael hi'n anodd yn ystod y blynyddoedd diwethaf: dod yn agos at y gynulleidfa fwyaf diddyled. Nid yw hyn mor hawdd i'w wneud, er bod y dasg yn cael ei hwyluso'n sylweddol gan wasanaethau talu a gwiriadau electronig trwy un OFD (gweithredwr data cyllidol). Er mwyn dod mor agos â phosibl, mae cwmnïau hyd yn oed yn ceisio olrhain a “meithrin” cwsmeriaid posibl o blentyndod.: trwy gemau ar-lein, teganau rhyngweithiol a gwasanaethau addysgol.

Sut mae'n gweithio?

Mae'r cyfleoedd mwyaf ar gyfer casglu data gan gorfforaethau byd-eang sy'n berchen ar sawl gwasanaeth ar unwaith. Bellach mae gan Facebook fwy na 2,5 biliwn o ddefnyddwyr gweithredol. Ar yr un pryd, mae'r cwmni hefyd yn berchen ar wasanaethau eraill: Instagram - mwy nag 1 biliwn, WhatsApp - mwy na 2 biliwn ac eraill.

Ond mae gan Google hyd yn oed mwy o ddylanwad: mae Gmail yn cael ei ddefnyddio gan 1,5 biliwn o bobl yn y byd, 2,5 biliwn arall gan yr OS symudol Android, mwy na 2 biliwn gan YouTube. Ac nid yw hynny'n cyfrif y chwiliad Google a apps Google Maps, y siop Google Play, a'r porwr Chrome. Mae'n parhau i gau eich banc ar-lein - a bydd Google yn gallu gwybod yn llythrennol popeth amdanoch chi. Gyda llaw, mae Yandex eisoes gam ymlaen yn hyn o beth, ond dim ond y gynulleidfa sy'n siarad Rwsieg y mae'n ei chynnwys.



???? Yn gyntaf oll, mae gan gwmnïau ddiddordeb yn yr hyn rydyn ni'n ei bostio a'r hyn rydyn ni'n ei hoffi ar rwydweithiau cymdeithasol. Er enghraifft, os yw'r banc yn gweld eich bod yn briod ac yn hoff o ferched ar Instagram neu Tinder, rydych chi'n fwy tebygol o gymeradwyo benthyciad defnyddiwr. Ac mae'r morgais ar y teulu wedi mynd.

Mae hefyd yn bwysig pa hysbysebion rydych chi'n clicio arnyn nhw, pa mor aml a gyda pha ganlyniad.

(Ie Y cam nesaf yw negeseuon preifat: maent yn cynnwys llawer mwy o wybodaeth. Gollyngwyd negeseuon ar VKontakte, Facebook, WhatsApp a negeswyr gwib eraill. Yn ôl iddynt, gyda llaw, mae'n hawdd olrhain y geolocation ar adeg anfon y neges. Yn sicr, rydych chi wedi sylwi: pan fyddwch chi'n trafod prynu rhywbeth neu archebu pizza gyda rhywun, mae hysbysebu perthnasol yn ymddangos ar unwaith yn y porthiant.

🚕 Mae data mawr yn cael ei ddefnyddio a'i “gollwng” gan wasanaethau danfon a thacsi. Maen nhw'n gwybod ble rydych chi'n byw ac yn gweithio, beth rydych chi'n ei garu, beth yw eich incwm bras. Mae Uber, er enghraifft, yn dangos y pris yn uwch os ydych chi'n gyrru adref o'r bar ac yn amlwg wedi gorwneud. A phan fydd gennych griw o agregwyr eraill ar eich ffôn, i'r gwrthwyneb, byddant yn cynnig rhai rhatach.

(Ie Mae yna wasanaethau sy'n defnyddio lluniau a fideos i gasglu cymaint o wybodaeth â phosib. Er enghraifft, llyfrgelloedd gweledigaeth gyfrifiadurol - mae gan Google un. Maen nhw'n eich sganio chi a'ch amgylchoedd i weld pa faint neu daldra ydych chi, pa frandiau rydych chi'n eu gwisgo, pa gar rydych chi'n ei yrru, p'un a oes gennych chi blant neu anifeiliaid anwes.

(Ie Gall y rhai sy'n darparu pyrth SMS i fanciau ar gyfer eu post olrhain eich pryniannau ar y cerdyn – gwybod y 4 digid olaf a rhif ffôn – ac yna gwerthu’r data hwn i rywun arall. Felly mae hyn i gyd yn sbam gyda gostyngiadau a pizza fel anrheg.

🤷️️ Yn olaf, rydym ni ein hunain yn gollwng ein data i'r gwasanaethau a'r cymwysiadau chwith. Cofiwch yr hype o gwmpas Getcontact, pan oedd pawb yn hapus i lenwi eu rhif ffôn i ddarganfod sut cafodd ei ysgrifennu gan eraill. A nawr dewch o hyd i'w cytundeb a darllenwch yr hyn y mae'n ei ddweud am drosglwyddo'ch data (difethwr: gall y perchnogion eu trosglwyddo i drydydd partïon yn ôl eu disgresiwn):

Pwy sy'n casglu data mawr a pham?

Gall corfforaethau gasglu a hyd yn oed werthu data defnyddwyr am flynyddoedd, hyd nes y daw i achos cyfreithiol - fel y digwyddodd gyda'r un Facebook. Ac yna chwaraewyd y rôl bendant gan y cwmni yn torri'r GDPR - cyfraith yn yr UE sy'n cyfyngu ar y defnydd o ddata yn llawer llymach na'r un Americanaidd. Enghraifft ddiweddar arall yw sgandal gwrthfeirws Avast: casglodd a gwerthodd un o wasanaethau atodol y cwmni ddata rhwng 100 a 400 miliwn o ddefnyddwyr.

Ond a oes gan hyn oll unrhyw fanteision i ni?

Sut mae data mawr yn helpu pob un ohonom?

Oes, mae yna ochr ddisglair hefyd.

Mae data mawr yn helpu i ddal troseddwyr ac atal ymosodiadau terfysgol, dod o hyd i blant coll a'u hamddiffyn rhag perygl.

Gyda'u cymorth nhw, rydyn ni rydym yn derbyn cynigion cŵl gan fanciau a gostyngiadau personol. Diolch iddynt ni nid ydym yn talu am lawer o wasanaethau a rhwydweithiau cymdeithasol sy'n ennill dim ond ar hysbysebu. Fel arall, byddai Instagram yn unig yn costio sawl mil o ddoleri y mis i ni.

Mae gan Facebook yn unig 2,4 biliwn o ddefnyddwyr gweithredol. Ar yr un pryd, roedd eu helw ar gyfer 2019 yn dod i $18,5 biliwn. Mae'n ymddangos bod y cwmni'n ennill hyd at $7,7 y flwyddyn gan bob defnyddiwr trwy hysbysebu.

Yn olaf, weithiau mae'n gyfleus: pan fydd y gwasanaethau eisoes yn gwybod ble rydych chi a beth rydych chi ei eisiau, a does dim rhaid i chi chwilio am y wybodaeth sydd ei hangen arnoch chi'ch hun.

Maes addawol arall ar gyfer cymhwyso Data Mawr yw addysg.

Yn un o brifysgolion America yn Virginia, cynhaliwyd astudiaeth i gasglu data ar fyfyrwyr y grŵp risg bondigrybwyll. Dyma'r rhai sy'n astudio'n wael, yn colli dosbarthiadau ac ar fin rhoi'r gorau iddi. Y ffaith yw bod tua 400 o bobl yn cael eu tynnu yn y taleithiau bob blwyddyn. Mae hyn yn ddrwg i brifysgolion, y mae eu graddfeydd wedi'u gostwng a'u cyllid wedi'i dorri, ac i'r myfyrwyr eu hunain: mae llawer yn cymryd benthyciadau ar gyfer addysg, a bydd yn rhaid eu had-dalu o hyd ar ôl eu didynnu. Heb sôn am golli amser a rhagolygon gyrfa. Gyda chymorth data mawr, mae'n bosibl adnabod yr amser sydd ar ei hôl hi a chynnig tiwtor, dosbarthiadau ychwanegol a chymorth arall wedi'i dargedu iddynt.

Mae hyn, gyda llaw, hefyd yn addas ar gyfer ysgolion: yna bydd y system yn hysbysu athrawon a rhieni - maen nhw'n dweud, mae gan y plentyn broblemau, gadewch i ni ei helpu gyda'n gilydd. Bydd Data Mawr hefyd yn eich helpu i ddeall pa werslyfrau sy'n gweithio'n well a pha athrawon sy'n esbonio'r deunydd yn haws.

Enghraifft gadarnhaol arall yw proffilio gyrfa.: dyma pryd mae pobl ifanc yn eu harddegau yn cael cymorth i benderfynu ar eu proffesiwn yn y dyfodol. Yma, mae data mawr yn caniatáu ichi gasglu gwybodaeth na ellir ei chael gan ddefnyddio profion traddodiadol: sut mae'r defnyddiwr yn ymddwyn, beth mae'n talu sylw iddo, sut mae'n rhyngweithio â'r cynnwys.

Yn yr un UDA, mae rhaglen cyfarwyddyd gyrfa - SC ACCELERATE. Mae, ymhlith pethau eraill, yn defnyddio technoleg GPS CareerChoice: maent yn dadansoddi data am natur myfyrwyr, eu tueddiadau i bynciau, cryfderau a gwendidau. Yna defnyddir y data i helpu pobl ifanc yn eu harddegau i ddewis y colegau cywir ar eu cyfer.


Tanysgrifiwch a dilynwch ni ar Yandex.Zen - technoleg, arloesi, economeg, addysg a rhannu mewn un sianel.

Gadael ymateb