sreda, 16. december 2015
Sprejet dogovor o novih ureditvi varstva osebnih podatkov v EU po 4 letih usklajevanj
Po slabih 4 letih usklajevanj je bil le sprejet politični dogovor, da se sprejme paket varstva osebnih podatkov prilagojen internetni dobi, tj. dva akta, Splošna uredba o varstvu podatkov in Direktiva o varstvu podatkov za policijske organe in organe kazenskega pravosodja. Besedila še ni, osnovni parametri pa so znani. Države bodo nato imele še 2 leti časa, da nadomestijo preživeto Direktivo 95/46/ES z dne 24. oktobra 1995.
EDPS objavil novo analizo izzivov velikega podatkovja (nov. 2015)
Evropski nadzornik za varstvo osebnih podatkov (EDPS) je objavil obsežnejše mnenje o izzivih in tveganjih velikega podatkovja.
Tveganja so:
- Lack of transparency
- Informational imbalance
- The risk of core principles of data protection
- The risks related to predictions and the a risk of a ‘dictatorship of data’
- Unfair and discriminatory conclusions
- Social and cultural segregation and exclusion
Več v mnenju.
torek, 15. december 2015
SODBA EVROPSKEGA SODIŠČA ZA ČLOVEKOVE PRAVICE ZAKHAROV PROTI RUSIJI, 47143/06
Pred
kratkim je veliki senat Evropskega sodišča za človekove pravice soglasno
sprejel odločitev, da je prišlo do kršitve pravice do zasebnosti in družinskega
življenja iz 8. člena konvencije v primeru Zakharov proti Rusiji.
Sodišče
se je v tem primeru ukvarjalo s prestrezanjem komunikacij med mobilnimi
telefoni v Rusiji. Pritožnik je bil urednik založniškega podjetja. Na sodišče
je vložil pritožbo zaradi ruske zakonodaje, ki od mobilnih operaterjev zahteva,
da morajo omogočiti pravosodnim organom, da le-ti izvajajo operativne
aktivnosti, ki omogočajo blanketno prestrezanje komunikacij brez zadostnih
zakonskih varovalk.
Čeprav
pritožnik ni mogel dokazati, da je bil žrtev konkretnega ukrepa, mu je sodišče
priznalo status žrtve. Zaradi pomanjkanja pravnih sredstev v nacionalnem
sistemu, prikrite narave prikritih teh ukrepov in zato, ker so ti ukrepi
prizadeli vse uporabnike mobilnih komunikacij, se je sodišče odločilo, da ne bo
presojalo relevantne ruske zakonodaje zgolj z vidika konkretnega nadzora,
kateremu je bil podrejen pritožnik, ampak z abstraktnega vidika. Poleg pritožniku
ni treba niti dokazati, da je obstajalo tveganje, da bi bila njegova
komunikacija nadzorovana.
Ker
nacionalna zakonodaja ne omogoča učinkovitega pravnega sredstva osebi, ki sumi,
da se zoper njo izvaja prikrito prestrezanje komunikacij, sam obstoj
zakonodaje, ki tak poseg omogoča, predstavlja poseg v pravico do zasebnosti po
osmem členu konvencije. Tak poseg sicer lahko zasleduje legitimni cilj zaščite
nacionalne in javne varnosti, preprečevanja kriminalitete in zaščite ekonomske
blaginje države, toda glede na to, da tak sistem prikritega nadzora z namenom
zaščite nacionalne varnosti lahko spodkoplje ali celo uniči demokracijo, se je
sodišče moralo prepričati, da v ruski zakonodaji obstajajo primerne in
učinkovite varovalke zoper zlorabo tega sistema.
Prav v
zvezi s tem pa je sodišče pomenljivo zaključilo, da ruska zakonodaja o
prestrezanju komunikacij ne zagotavlja primernih in učinkovitih garancij zoper
arbitrarnost in zoper tveganje zlorab, ki je inherentno vsakemu sistemu
prikritega nadzora in ki je še posebej visoko v sistemih, kakršen je v Rusiji,
kjer imajo obveščevalne službe in policija s tehničnimi sredstvi neposreden
dostop do vseh mobilnih telekomunikacij.
Še
posebej pa je sodišče izpostavilo naslednje pomanjkljivosti ruske ureditve;
okoliščine, v katerih je v Rusiji mogoče odrediti prikrit nadzor, trajanje
takih ukrepov, okoliščine, v katerih jih je treba prenehati izvajati, postopek
odreditve prestrezanja komunikacij, kot tudi shranjevanje in uničevanje
pridobljenih podatkov ter nadzor nad prestrezanjem komunikacij.
Učinkovitost
pravnih sredstev za izpodbijanje prestrezanja komunikacij je še posebej
zmanjšana zato, ker so na voljo zgolj osebam, ki lahko dokažejo, da so bile
žrtve prestrezanja komunikacij, tak dokaz pa je probatio diabolica, glede na odsotnost kakršnega koli sistema
obveščanja o izvajanju ukrepov ali možnosti dostopanja do podatkov o
prestrezanju komunikacij.
četrtek, 10. december 2015
Temačni del interneta (the darknet)
Sredi devetdesetih let 20. stoletja se je majhna raziskovalna skupina mornariškega laboratorija pod vodstvom matematika Paula Syversona lotila novega ambicioznega raziskovalnega projekta. Razviti so želeli tehnologijo, ki bi ljudem omogočala, da bi postali nevidni. Vendar ne na način, da jih ne bi bilo mogoče opaziti v resničnem svetu, temveč da bi bili nevidni oziroma bolje rečeno anonimni v navidezni realnosti interneta. Vojska, obveščevalne službe in diplomati so želeli, da raziskovalci iznajdejo tehniko, ki bi jim omogočala, da bi lahko od koderkoli na svetu po internetu pošiljali in sprejemali informacije, ne da bi pri tem razkrili svojo pravo identiteto.
Metodo so poimenovali the onion routing ali s kratico tor. Ker pa so potrebovali veliko mrežo neodvisnih računalnikov, med katerimi bi si podajali pakete, da bi se sled naposled izgubila, projekta niso mogli zadržati v tajnosti, ampak so ga leta 2004 odprli za javnost. Da bi sistem sploh lahko deloval tudi za vohune in diplomate, so morali vanj vključiti čim več uporabnikov, ki so služili za vmesnike pri naključnih »podajah«. Danes lahko omrežje tor uporabljamo preprosto tako, da si preko spletne strani www.torproject.org prenesemo brskalnik tor, ki je na voljo za računalnike, tablice in pametne telefone. Ko se zažene, se poveže v omrežje tor in nam omogoča, da po internetu brskamo anonimno.
Omrežje tor ne omogoča anonimnosti le uporabnikom interneta, temveč tudi spletnim stranem. Enako kot ljudje, ki brskajo po internetu, imajo svoje IP-naslove, preko katerih jih lahko identificiramo, tudi spletni strežniki. Podobno kot se lahko z omrežjem tor v anonimnost skrijejo uporabniki interneta, se lahko skrijejo tudi ustvarjalci spletnih strani. S pomočjo brskalnika tor lahko obiskujemo tudi spletne strani s končnico .onion, identiteta avtorjev katerih ni nujno znana. To so lahko povsem običajne spletne strani, kot je denimo spletna stran facebook.onion, ki omogoča alternativni dostop do facebooka, lahko pa so njihovi avtorji kriminalne združbe, ki se želijo preko anonimnosti skriti pred kazenskim pregonom.
Najbolj slavno spletno stran na temačnem delu interneta (the darknet), kot pravijo spletnim stranem, ki jih z iskalniki, kot je denimo google, ne moremo najti, je leta 2011 postavil neznanec z vzdevkom Altoid. Prišel je na idejo, da bi vzpostavil spletno tržnico za preprodajo blaga, s katerim trgovanje ni dovoljeno. Na prvi pogled je šlo za dokaj običajno spletno trgovino, kjer si lahko prebral recenzije in ocene posameznega izdelka in se odločil za nakup, plačal z valuto bitcoin, paket z naročenim blagom pa dobil čez nekaj dni po pošti. Vendar se preko te spletne strani ni trgovalo z običajnimi izdelki, ampak s prepovedanimi drogami in orožjem, menda pa si lahko najel celo morilca.
Altoid je vzpostavil anonimno tržnico, poimenovano silk road, in pobiral odstotke od vsake kupčije, ki so jo denimo dobavitelji drog sklenili s svojimi strankami. Posel je cvetel, dokler niso kljub pazljivosti avtorja ilegalne spletne trgovine v začetku oktobra 2013 aretirali agenti FBI v javni knjižnici v San Franciscu. S trikom jim ga je uspelo prijeti celo s prižganim prenosnim računalnikom, kar je olajšalo dokazni postopek na sodišču. Leta 1984 rojeni Ross Ulbricht, kot je bilo avtorju spletne strani silk road dejansko ime, je bil februarja 2015 obsojen na dosmrtno ječo brez možnosti, da kadarkoli zaprosi za predčasni izpust iz zapora. Vendar se je na temačnem internetu že kmalu po razkrinkanju in aretaciji avtorja prve verzije pojavila nova različica spletne prodajalne drog.
Običajni uporabniki interneta imamo pogosto napačen vtis, da se anonimno in nevidno sprehajamo po spletnih straneh, prenašamo datoteke in pišemo komentarje po forumih. V resnici dobi vsakdo, ki se poveže v internet, svojo identifikacijsko številko (IP-naslov), ki ga ves čas spremlja. Tudi če z lažnim imenom objavljamo protivladne komentarje, nas bodo organi pregona v državi, ki ne pozna svobode govora, brez težav našli preko našega IP-naslova.
Raziskovalce je zato zanimalo, kako bi omogočili anonimnost uporabnikom interneta, če morajo ti obvezno uporabljati IP-naslove, saj brez njih internet ne deluje. Domislili so se, da bi visoko stopnjo anonimnosti lahko dosegli s pomočjo mreže računalnikov, med katerimi bi potovali podatki, preden bi dosegli želeni cilj. Metodo si najlažje predstavljamo s preprosto prispodobo. Namesto da bi si žogo dve osebi izmenjevali z neposrednimi podajami, ki jih lahko vsi vidijo, prva oseba na žogo napiše ime osebe, ki bi ji žogo rada podala, nato pa jo vrže v množico, ki si žogo nekaj časa podaja v naključnem zaporedju. Po določenem številu takšnih naključnih izmenjav žoga iz množice odleti k osebi, ki ji je namenjena.
Pošiljatelj in naslovnik bi si lahko tako preko interneta izmenjala informacije, ne da bi mogli opazovalci dogajanja ugotoviti, kdo dejansko medsebojno komunicira. Zakodirani paket z informacijo bi potoval po mreži in izstopil na povsem naključnem mestu, tako da iz zadnje »podaje« ne bi mogli sklepati, kdo je dejansko informacijo poslal na pot.
Raziskovalce je zato zanimalo, kako bi omogočili anonimnost uporabnikom interneta, če morajo ti obvezno uporabljati IP-naslove, saj brez njih internet ne deluje. Domislili so se, da bi visoko stopnjo anonimnosti lahko dosegli s pomočjo mreže računalnikov, med katerimi bi potovali podatki, preden bi dosegli želeni cilj. Metodo si najlažje predstavljamo s preprosto prispodobo. Namesto da bi si žogo dve osebi izmenjevali z neposrednimi podajami, ki jih lahko vsi vidijo, prva oseba na žogo napiše ime osebe, ki bi ji žogo rada podala, nato pa jo vrže v množico, ki si žogo nekaj časa podaja v naključnem zaporedju. Po določenem številu takšnih naključnih izmenjav žoga iz množice odleti k osebi, ki ji je namenjena.
Pošiljatelj in naslovnik bi si lahko tako preko interneta izmenjala informacije, ne da bi mogli opazovalci dogajanja ugotoviti, kdo dejansko medsebojno komunicira. Zakodirani paket z informacijo bi potoval po mreži in izstopil na povsem naključnem mestu, tako da iz zadnje »podaje« ne bi mogli sklepati, kdo je dejansko informacijo poslal na pot.
Metodo so poimenovali the onion routing ali s kratico tor. Ker pa so potrebovali veliko mrežo neodvisnih računalnikov, med katerimi bi si podajali pakete, da bi se sled naposled izgubila, projekta niso mogli zadržati v tajnosti, ampak so ga leta 2004 odprli za javnost. Da bi sistem sploh lahko deloval tudi za vohune in diplomate, so morali vanj vključiti čim več uporabnikov, ki so služili za vmesnike pri naključnih »podajah«. Danes lahko omrežje tor uporabljamo preprosto tako, da si preko spletne strani www.torproject.org prenesemo brskalnik tor, ki je na voljo za računalnike, tablice in pametne telefone. Ko se zažene, se poveže v omrežje tor in nam omogoča, da po internetu brskamo anonimno.
Omrežje tor ne omogoča anonimnosti le uporabnikom interneta, temveč tudi spletnim stranem. Enako kot ljudje, ki brskajo po internetu, imajo svoje IP-naslove, preko katerih jih lahko identificiramo, tudi spletni strežniki. Podobno kot se lahko z omrežjem tor v anonimnost skrijejo uporabniki interneta, se lahko skrijejo tudi ustvarjalci spletnih strani. S pomočjo brskalnika tor lahko obiskujemo tudi spletne strani s končnico .onion, identiteta avtorjev katerih ni nujno znana. To so lahko povsem običajne spletne strani, kot je denimo spletna stran facebook.onion, ki omogoča alternativni dostop do facebooka, lahko pa so njihovi avtorji kriminalne združbe, ki se želijo preko anonimnosti skriti pred kazenskim pregonom.
Najbolj slavno spletno stran na temačnem delu interneta (the darknet), kot pravijo spletnim stranem, ki jih z iskalniki, kot je denimo google, ne moremo najti, je leta 2011 postavil neznanec z vzdevkom Altoid. Prišel je na idejo, da bi vzpostavil spletno tržnico za preprodajo blaga, s katerim trgovanje ni dovoljeno. Na prvi pogled je šlo za dokaj običajno spletno trgovino, kjer si lahko prebral recenzije in ocene posameznega izdelka in se odločil za nakup, plačal z valuto bitcoin, paket z naročenim blagom pa dobil čez nekaj dni po pošti. Vendar se preko te spletne strani ni trgovalo z običajnimi izdelki, ampak s prepovedanimi drogami in orožjem, menda pa si lahko najel celo morilca.
Altoid je vzpostavil anonimno tržnico, poimenovano silk road, in pobiral odstotke od vsake kupčije, ki so jo denimo dobavitelji drog sklenili s svojimi strankami. Posel je cvetel, dokler niso kljub pazljivosti avtorja ilegalne spletne trgovine v začetku oktobra 2013 aretirali agenti FBI v javni knjižnici v San Franciscu. S trikom jim ga je uspelo prijeti celo s prižganim prenosnim računalnikom, kar je olajšalo dokazni postopek na sodišču. Leta 1984 rojeni Ross Ulbricht, kot je bilo avtorju spletne strani silk road dejansko ime, je bil februarja 2015 obsojen na dosmrtno ječo brez možnosti, da kadarkoli zaprosi za predčasni izpust iz zapora. Vendar se je na temačnem internetu že kmalu po razkrinkanju in aretaciji avtorja prve verzije pojavila nova različica spletne prodajalne drog.
sobota, 21. november 2015
Snowden nas pouči, kako ohraniti zasebnost na internetu
Nekaj navodil za običajne uporabnike interneta:
- The first step that anyone could take is to encrypt their phone calls and their text messages. You can do that through the smartphone app Signal, by Open Whisper Systems. It’s free, and you can just download it immediately. And anybody you’re talking to now, their communications, if it’s intercepted, can’t be read by adversaries. [Signal is available for iOS and Android, and, unlike a lot of security tools, is very easy to use.]
- You should encrypt your hard disk, so that if your computer is stolen the information isn’t obtainable to an adversary — pictures, where you live, where you work, where your kids are, where you go to school. [I’ve written a guide to encrypting your disk on Windows, Mac, and Linux.]
- Use a password manager. One of the main things that gets people’s private information exposed, not necessarily to the most powerful adversaries, but to the most common ones, are data dumps. Your credentials may be revealed because some service you stopped using in 2007 gets hacked, and your password that you were using for that one site also works for your Gmail account. A password manager allows you to create unique passwords for every site that are unbreakable, but you don’t have the burden of memorizing them. [The password manager KeePassX is free, open source, cross-platform, and never stores anything in the cloud.]
- The other thing there is two-factor authentication. The value of this is if someone does steal your password, or it’s left or exposed somewhere … [two-factor authentication] allows the provider to send you a secondary means of authentication — a text message or something like that. [If you enable two-factor authentication, an attacker needs both your password as the first factor and a physical device, like your phone, as your second factor, to login to your account. Gmail, Facebook, Twitter, Dropbox, GitHub, Battle.net, and tons of other services all support two-factor authentication.] ...
- I think Tor is the most important privacy-enhancing technology project being used today. I use Tor personally all the time. We know it works from at least one anecdotal case that’s fairly familiar to most people at this point. That’s not to say that Tor is bulletproof. What Tor does is it provides a measure of security and allows you to disassociate your physical location. … But the basic idea, the concept of Tor that is so valuable, is that it’s run by volunteers. Anyone can create a new node on the network, whether it’s an entry node, a middle router, or an exit point, on the basis of their willingness to accept some risk. The voluntary nature of this network means that it is survivable, it’s resistant, it’s flexible.
[Tor Browser is a great way to selectively use Tor to look something up and not leave a trace that you did it. It can also help bypass censorship when you’re on a network where certain sites are blocked. If you want to get more involved, you can volunteer to run your own Tor node, as I do, and support the diversity of the Tor network.]
Why Machines Discriminate—and How to Fix Them
"Številke govorijo same zase", gre pregovorna modrost. Vendar raziskovalka Crawford opoozarja:
"...big data sets can perpetuate the same biases present in our culture".
Po drugi strani pa pregovorni "algoritmi delajo, kar jim ukažemo", tudi ne drži povsem:
"the decisions that machine-learning algorithms spit out are a lot more complicated and opaque than people think..., which makes tracking down an offending line of code a near impossibility."
Predavanje dostopno.
ponedeljek, 12. oktober 2015
Ste pripravljeni na »big data«?
Na letošnjem Statističnem dnevu bodo o
potencialu masivnih podatkov razpravljali priznani tuji in domači strokovnjaki.
10. november 2015 na Brdu pri Kranju
Udeležba je brezplačna.
10. november 2015 na Brdu pri Kranju
Udeležba je brezplačna.
nedelja, 11. oktober 2015
Malo in veliko podatkovje
Pojem malo podatkovje (little data) se uporablja za opis podatkov, ki jih o posamezniku zbirajo razni senzorji v okolici, na telesu ali v njegovem pametnem telefonu. Ključno za to označbo je, da se podatki navezujejo na enega samega konkretnega človeka. To so lahko na primer lokacijski podatki s telefona ali navigacijske naprave za več let nazaj, podatki senzorja srčnega utripa, ki ga uporabljamo med tekom, ali pa zgolj informacije, kdaj smo vstali in kdaj gremo spat, kar lahko naš telefon tudi dokaj učinkovito in vestno beleži. Seveda je takšnih informacij vsako leto več, saj količina najrazličnejših senzorjev, ki jih vsakodnevno uporabimo, hitro raste.Več o tej temi:
Pojem malo podatkovje se od pojma veliko podatkovje (big data) razlikuje po tem, da se prvi nanaša na konkretnega posameznika, medtem ko drugi označuje podatke, ki so zbrani na osnovi opazovanja velike množice ljudi. Obema pa je skupna želja, da bi na osnovi velike količine meritev prišli do informacij o delovanju ljudi, ki niso očitne in se jih praviloma sploh ne zavedamo.
Razliko med velikim in malim podatkovjem lahko opredelimo tudi preko tega, kaj želimo z njimi doseči. Malo podatkovje služi predvsem posameznikom pri doseganju osebnih ciljev, medtem ko veliko podatkovje omogoča velikim organizacijam v obliki korporacij in držav, da uresničujejo svoje specifično poslanstvo, ki ni nujno v soglasju z interesi posameznikov.
Industrija sreče - Kvarkadabra
Industrija sreče: Kmalu bomo vedeli, kako človeka narediti srečnega | Dnevnik
petek, 2. oktober 2015
Sérvulo & Associados - Sociedade de Advogados, RL proti Portugalski
Evropsko sodišče za
človekove pravice je v začetku septembra sprejelo zanimivo odločitev Sérvulo
& Associados - Sociedade de Advogados, RL proti Portugalski. Pritožnika je predstavljala
odvetniška pisarna in v njej zaposleni odvetniki. Na Portugalskem je bila
namreč sprožena kazenska preiskava zaradi suma korupcije in pranja denarja v
zvezi s portugalskim nakupom dveh podmornic od Nemčije zoper sedem portugalskih
in nemških državljanov, vključno zoper odvetnika, ki je delal v imenu
pritožnika. Izdana je bila sodna odredba za preiskavo prostorov omenjene
odvetniške pisarne in za zaseg relevantnih predmetov. Preiskovalni sodnik je odobril
tudi zaseg elektronskih podatkov na podlagi 35 ključnih besed, kot sta na
primer finančni prispevek, financiranje. Že pred izvedbo hišne preiskave se je
pritožnik pritožil, da so izbrane ključne besede preveč splošne, da jih pisarna
pogosto uporablja in bi zato njihova uporaba vodila k nesorazmernemu zasegu
dokumentov, ki so nerelevantni za preiskavo in pokriti s poklicno skrivnostjo.
Preiskovalni sodnik je odobril pritožbi in odredil zapečatenje zaseženih
predmetov. Pritožbeno sodišče je zavrnilo pritožbo, preiskovalni sodnik je
zaukazal uničenje 850 dokumentov z osebni podatki ali poklicno skrivnostjo,
preiskava pa je bila ustavljena.
Sodišče je pritožbo
obravnavalo z vidika osmega člena konvencije in ugotovilo, da portugalski Zakon
o kazenskem postopku ter Statut odvetniške zbornice zagotavljata postopkovne
varovalke glede hišne preiskave in zasega predmetov v odvetniških pisarnah in
da so bile vse te varovalke spoštovane v konkretnem primeru. Vsi pritožniki so
bili prisotni med hišno preiskavo, vključno s predstavnikom Odvetniške
zbornice. Preiskovalni sodnik je tudi nadzoroval dejanja ter tako deloval v
vlogi sodnika garanta pred, med in po dejanju. Predvsem pa je Evropsko sodišče
za človekove pravice izpostavilo garantno vlogo sodišč v tem primeru.
Preiskovalni sodnik je tisti, ki je odločil, kateri dokument je relevanten za
preiskavo in kateri ne, in je posledično zahteval uničenje 850 dokumentov, ki
so bili zaščiteni kot osebni podatki, poklicna skrivnost ali pa so bili očitno nerelevantni
za primer. Evropsko sodišče je še odločilo, da država ni dolžna vračati kopij
podatkov, le originale, kar pa je že storila. Na podlagi spoštovanja v zakonu
predpisanih varovalk, ki so tudi v konkretnem primeru preprečile zlorabe in
arbitrarnost, je zato ugotovilo, da poseg v zasebnost iz osmega člena
konvencije ni bil nesorazmeren in da osmi člen posledično ni bil kršen.
Odločitev je relevantna
tudi za slovensko ureditev, saj je trenutno pred Ustavnim sodiščem odprta
presoja ustavnosti in odločanje o ustavni pritožbo zaradi izvedenih hišnih
preiskav in preiskav elektronskih naprav pri odvetnikih, a za razliko od
portugalske ureditve trenutna slovenska ureditev in praksa dajeta manj poudarka
sodni kontroli dejanj.
torek, 29. september 2015
Kaj nam veliko podatkovje lahko pove o beguncih?
Ta kratki filmček na kratko opiše, kaj uporabniki sirskega googla iščejo na spletu. Nekatera njihova iskanja so razmeroma pričakovana - "Imigracija v Nemčijo" in "Azil v Nemčiji", "Madžarska in begunci", zemljevidi in razdalje med kraji, ki jih morajo prepotovati na poti v obljubljeno deželo.
Manj pričakovana in najbrž še bolj boleča so iskanja tistih, ki ostajajo doma: "Rdeči križ Sirija", "Kako doma oskrbeti opekline", "Oživljanje usta na usta" in podobno.
Podatki, ki dajejo neverjetno dobro sliko o dogajanju v sedanjosti, pa lahko pridejo prav tudi pri napovedovanju prihodnjih dogodkov - glede na iskalne pojme, pravijo avtorji posnetka, ni pričakovati zmanjšanja begunskega eksodusa is Sirije.
Manj pričakovana in najbrž še bolj boleča so iskanja tistih, ki ostajajo doma: "Rdeči križ Sirija", "Kako doma oskrbeti opekline", "Oživljanje usta na usta" in podobno.
Podatki, ki dajejo neverjetno dobro sliko o dogajanju v sedanjosti, pa lahko pridejo prav tudi pri napovedovanju prihodnjih dogodkov - glede na iskalne pojme, pravijo avtorji posnetka, ni pričakovati zmanjšanja begunskega eksodusa is Sirije.
ponedeljek, 28. september 2015
Algorithmic storytelling
Zanimiv projekt, ki se je začel že pred 10 leti: pobrati vse stavke na spletu, ki vsebujejo sintagmo: "čutim" ("I feel" in "I am feeling"). Tako lahko primerjamo:
- ali se Evropejci počutijo bolj žalostne od Amerosov?
- ali se ženske počutijo pogosteje debele kot moški?
- kakšna so najbolj reprezentativna občutja 30-letnic v New Yorku?
- kako se ljudje počutijo v Bagdadu?
Zdaj pa si zamislimo manj "nedolžno" idejo in kako bi to lahko delovalo pri drugačnih "sentiment analizah" varnostnih organov.
O metodi:
"
At the core of We Feel Fine is a data collection engine that automatically scours the Internet every ten minutes, harvesting human feelings from a large number of blogs. Blog data comes from a variety of online sources, including LiveJournal, MSN Spaces, MySpace, Blogger, Flickr, Technorati, Feedster, Ice Rocket, and Google.
We Feel Fine scans blog posts for occurrences of the phrases "I feel" and "I am feeling". This is an approach that was inspired by techniques used in Listening Post, a wonderful project by Ben Rubin and Mark Hansen.
Once a sentence containing "I feel" or "I am feeling" is found, the system looks backward to the beginning of the sentence, and forward to the end of the sentence, and then saves the full sentence in a database.
"
O rezultatih:
"
The result is a database of several million
human feelings, increasing by 15,000 - 20,000 new feelings per day. Using a
series of playful interfaces, the feelings can be searched and sorted across a
number of demographic slices, offering responses to specific questions like...
"
Več na:
http://wefeelfine.org/methodology.html
sreda, 2. september 2015
PREDLOG NOVELE ZAKONA O NALOGAH IN POOBLASTILIH POLICIJE
V avgustu je slovenska
Policija kot delovno gradivo predstavila osnutek spremembe Zakona o nalogah in
pooblastilih policije.[1] Predlog posega tudi na
področje posegov v zasebnost, zato velja predstaviti določene predloge sprememb.
Najprej velja omeniti
spremembo 11. člena zakona, ki se zdi zgolj tehnična, saj naj bi se izraz kriminalistično
pridobivanje in vrednotenje informacij spremenil v kriminalistično obveščevalno
dejavnost. A je treba to spremembo verjetno povezati tudi z bolj daljnosežnimi
spremembami 23. in 24. člena zakona, ki govorita o prirejeni identiteti tajnih
delavcev. Trenutno besedilo predloga namreč omogoča ustvarjanje prirejene
identitete tudi pred samo izvedbo prikritega preiskovalnega ukrepa, a povsem
neomejeno glede na čas trajanja, povezavo z določeno zadevo, osebo, akcijo,
itd.
Omeniti velja tudi
potencialno širitev varnostnega pregleda na ustno votlino,[2] ter zniževanje standardov
za opravljanje pregleda osebe po 52. členu Zakona o nalogah in pooblastilih
policije. Temeljna pogoja, da se je to pooblastilo sploh uvedlo v zakon
(neposredna zaznava policista, da ima oseba pri sebi predmete, ki jih je treba
zaseči, ter velika verjetnost za posest teh predmetov), se znižujeta. Dovolj
naj bi bila verjetnost posesti prepovedanega predmeta, policist pa bi to lahko
ugotavljal ne samo na podlagi neposredne zaznave, ampak tudi na podlagi
ugotovljenih dejstev in okoliščin.
Z vidika zasebnosti je
zanimiv tudi predlog Policije, da bi pri nadzoru cestnega prometa na javnih
cestah in drugih javnih površinah smeli uporabljati tehnična sredstva za
optično prepoznavo registrskih tablic z namenom ugotavljanja pogojev za
udeležbo voznika in vozila v cestnem prometu ter iskanja oseb in predmetov.[3]
Tudi pri uporabi
tehničnih sredstev pri izvajanju policijskih pooblastil in spremljanju javnih
zbiranj naj bi prišlo do sprememb. Policija pri tem skuša bolj natančno
opredeliti meje pooblastila; način njihove uporabe oziroma njihove nosilce. Tako
naj bi se ta tehnična sredstva (ki naj bi vključevala tudi drone) uporabljala neposredno,
iz vozila, plovila, zrakoplova, iz zgradb ali drugih objektov, po trenutnem
predlogu pa naj bi obstajala tudi možnost uporabe tehničnih sredstev, ki so v
lasti drugih državnih organov in pravnih oseb.[4]
ponedeljek, 31. avgust 2015
nedelja, 30. avgust 2015
kolokvij
PRAVO V DOBI
VELIKEGA PODATKOVJA:
Ali lahko računalnik sodi bolje kot sodnik?
31.avgust 2015 ob 12. uri
Pravna fakulteta Univerze v Ljubljani
(Zlata
predavalnica)
Plenarno predavanje:
doc. dr. Jure Leskovec, Univerza Stanford (ZDA)
ponedeljek, 24. avgust 2015
Postdoc o negotovostih velikega podatkovja, Univerza v Kopenhagnu
Big data archives offer themselves as reassuring, neutral and innovative systems for the oversight of today’s information deluge. Yet recent information scandals suggest that big data entail not only big possibilities, but also a considerable range of uncertainties.
Več na strani univerze.
Več na strani univerze.
ponedeljek, 17. avgust 2015
Algoritem, ki napove sodbo sodišča
Tule je povezava na članek Algoritem, ki napove sodbo sodišča, ki govori o zgodovini moralne statistike in nekaterih sodobnih aplikacijah velikih podatkov na medicino in pravo. Odlomek iz članka:
Vplivni ameriški pravni teoretik Richard Posner je nekoč, ko je bil še mlajši sodnik, obravnaval spor glede patenta za avtomatsko izbiranje televizijskih kanalov na osnovi gledalčevih preferenc. Izbor kanalov naj bi potekal na podoben način, kot nam denimo Amazon priporoča nove knjige ali Netflix zanimive filme. Algoritmi na osnovi naših preteklih ogledov, iskanj in nakupov presodijo, za katera dela obstaja velika verjetnost, da nam bodo všeč, in nam jih priporočijo. Posner je ob spremljanju argumentov med sojenjem pomislil, da bi lahko na podoben način, z avtomatsko analizo vsega, kar je posamezni sodnik kdajkoli napisal in izrekel, z veliko verjetnostjo napovedovali tudi, kako bo sodnik odločil v primeru, ki ga trenutno obravnava.
Nekaj podobnega so dejansko preizkusili v študiji The Supreme Court Forecasting Project leta 2004, ko je algoritmu uspelo pravilno napovedati kar 75 odstotkov razsodb ameriškega vrhovnega sodišča, medtem ko je ekspertni skupini pravnikov, ki je prav tako poskušala napovedati odločitve v istem časovnem obdobju, to uspelo le v 59 odstotkih primerov. Grenko spoznanje ob tej študiji je bilo, da so tudi najbolj ugledni in učeni sodniki pri odločanju močno podvrženi svojim ideološkim preferencam ali predsodkom. Čeprav naj v idealnem svetu podatek, ali je sodnik v preteklosti volil republikance ali demokrate, ne bi smel predvideti njegovega sojenja, je bila prav ločnica med konservativnim in liberalnim svetovnim nazorom pomemben parameter, ki ga je uporabljal algoritem (Več: Algoritem, ki napove sodbo sodišča)
petek, 24. julij 2015
M.N. IN DRUGI PROTI SAN MARINU (2015)
V začetku julija je veliki senat Evropskega sodišča za
človekove pravice sprejelo zanimivo in aktualno sodbo s področja varstva
zasebnosti, in sicer v zadevi M.N. in drugi proti San Marinu (28005/12, http://hudoc.echr.coe.int/eng#{"itemid":["001-155819"]}
). Sodišče je ugotovilo kršitev pravice do varstva zasebnosti osmega člena
konvencije v primeru pritožnika M.N..
Pred letom 2009 je Italija sprožila več kazenskih postopkov
v zvezi s pranjem denarja, zlorabo položaja pri trgovanju s finančnimi
inštrumenti, itd., a ne zoper pritožnike. S temi kaznivimi dejanji naj bi bilo
povezano tudi podjetje San Marino Investimenti S.A., katerega delnice naj bi
bile uporabljene pri spornih finančnih operacijah. Italijanski državni tožilec
je zaprosil San Marino za pomoč pri pridobivanju dokumentacije in pri izvedbi
hišnih preiskav pri finančnih inštitucijah v San Marinu. Sodišče v San Marinu je
tako odobrilo preiskavo vseh bank, ficuiarjev ter skladov v San Marinu z
namenom pridobiti podatke o računih, ki bi jih bilo mogoče povezati s San
Marino Investimenti S.A.. V sklopu teh preiskav je bila zasežena tudi bančna
dokumentacija pritožnikov, čeprav sami niso bili predmet kazenskega postopka,
in pritožniki so po izčrpanih notranjih pravnih sredstvih vložili pritožbo na
Evropsko sodišče za človekove pravice zaradi kršitve osmega člena konvencije.
Sodišče je odločilo, da gre v primeru bančnih podatkov za
osebne podatke, ki se nanašajo na posameznika, ne glede na to, ali vsebujejo
občutljive podatke ali ne in ne glede na to, kdo je lastnik nosilca podatkov. Bančni
podatki so zato zaščiteni z osmim členom konvencije oziroma s terminom
zasebnost. Relevantna pa je tudi zaščita dopisovanja, saj je zaseg predmetov
obsegal tudi pisma in elektronsko pošto (par. 51-55).
Zaseg, kopiranje in branje takih podatkov zato predstavlja
poseg v osmih člen konvencije, ki ga je nacionalno pravo omogočalo tudi v
razmerju do tretjih oseb, ki niso stranka kazenskega postopka (načelo zakonitosti),
ta poseg pa je zasledoval legitimni cilj (prevencija kaznivih dejanj, zaščita
pravic drugih in ekonomske blaginje) (par. 74, 75).
Sodišče je odločilo, da poseg ni bil nujen v demokratični
družbi, ker ni omogočal učinkovitih procesnih garancij. M.N., ki ni bil obdolžen
nobenega kaznivega dejanja, pa tudi ne lastnik bančnih institutov, ni mogel po
pravu San Marina kasneje izpodbijati zakonitost preiskave, zasega, kopiranja in
kasnejše hrambe informacij iz dokumentacije, ki se je nanašala nanj. Ker ni bil
obdolžen kaznivega dejanja, je bil v primerjavi z obdolžencem v precej slabšem
procesnem položaju, zato ni bil deležen učinkovite zaščite po nacionalnem
pravu. Sodišče je ob tem še posebej poudarilo, da je pomanjkanje pravne zaščite
oziroma možnosti za izpodbijanje dejanj še toliko bolj relevantno, ker je bila
preiskava izvršena na državni ravni in so bile dejansko preiskane vse finančne
inštitucije v San Marinu, torej je bilo oseb, proti katerim je bil izvršen
poseg v zasebnost, hkrati pa tudi oseb, ki niso smele po pravu San Marina kasneje
izpodbijati to dejanje, mnogo (par. 78-85), pravzaprav več kot obdolžencevv
Izsledke tega primera lahko apliciramo tudi na slovensko
zakonodajo. Slovenski Zakon o kazenskem postopku ravno tako omogoča poseg v
bančno tajnost tretjih oseb, za katere je mogoče utemeljeno sklepati, da so
udeležene v finančnih transakcijah ali poslih osumljenca ali obdolženca, če bi
ti podatki utegnili biti dokaz v kazenskem postopku ali če so potrebni zaradi
zasega predmetov ali zavarovanja zahtevka za odvzem premoženjske koristi
oziroma premoženja v vrednosti premoženjske koristi (156. člen). Te osebe pa
nimajo možnosti zahtevati ekskluzije dokazov, pritožbe zoper odredbo
preiskovalnega sodnika ali kasnejšo (obsodilno) sodbo, ne morejo tudi vlagati
izrednih pravnih sredstev. Lahko pa se seznanijo z vsebino tako pridobljenih
podatkov pred njihovim uničenjem, če se kazenski pregon ne sproži (154. člen),
ali pa vložijo upravni spor v skladu z zakonom. A po mnenju Evropskega sodišča
za človekove pravice tako ali podobno sredstvo praviloma ne šteje za učinkovito
pravno sredstvo (par. 81).
četrtek, 23. julij 2015
Veliko podatkovje v znanosti
Štiri zgodbe o tem, kako veliko podatkovje spreminja znanstveno-raziskovalno delo, piše Guardian.
nedelja, 21. junij 2015
Različni pogledi na »veliko DNK podatkovje«
Znano je, da je Ustavno sodišče
Republike Slovenije v začetku leta 2014 kot neskladno z Ustavo razglasilo prvo
alinejo prvega odstavka 63. člena Zakona o policiji, ki je omogočala, da so se
lahko profili odvzetih vzorcev DNK oseb, ki so bile osumljene, niso pa bile
pravnomočno obsojene za očitano kaznivo dejanje, hranili vse do zastaranja
kazenskega pregona, in sicer za namen odkrivanja storilca kaznivega dejanja
oziroma zaradi ugotavljanja njegove istovetnosti (odločba US RS je dostopna TUKAJ). Ameriško
Vrhovno sodišče pa je malce pred tem (sredi leta 2013) v zadevi Maryland v.
King odločilo drugače oziroma smiselno potrdilo, da Zakon o zbiranju DNK zvezne države Maryland ni ustavno sporen.
Policija ameriške zvezne države Maryland je leta 2009 pridržala Alonza J. Kinga zaradi naklepnega ogrožanja varnosti druge osebe. Kasneje je bila obtožba za kaznivo dejanje umaknjena, King pa je bil kaznovan le za prekršek. Ob aretaciji je policija skladno z Zakonom o zbiranju DNK vzela vzorec Kingove njegove sline zaradi analize DNK. Ko je bila njegova DNK vnesena v bazo podatkov, se je pokazalo ujemanje z vzorcem DNK storilca do takrat še
nerazrešenega posilstva iz leta 2003. Posledično je bil King obtožen in na prvi stopnji tudi obsojen za kaznivo dejanje posilstva, ki ga je izvršil v letu 2003. Pritožbeno
sodišče je nato sodbo odpravilo, saj je ocenilo, da je bil odvzem sline zaradi pridobitve DNK v konkretnem primeru nerazumna
in posledično neustavna preiskava, ker je bilo Kingovo pričakovanje zasebnosti večje od
interesa zvezne države Maryland, da uporabi njegov DNK profil za
identifikacijo. O zadevi je dokončno
odločilo Vrhovno sodišče ZDA, ki je s tesno večino petih vrhovnih sodnikov
zavzelo stališče, da sta - kadar
policija na podlagi utemeljenega suma storitve hudega kaznivega dejanja pridrži
posameznika in ga privede na policijsko postajo - odvzem in analiza sline zaradi pridobitve
osumljenčevega DNK, podobno kot odvzem prstnih odtisov in fotografiranje legitimna
policijska postopka, ki sta razumna z vidika IV. amandmaja k ustavi ZDA, baze DNK profilov pa služijo legitimnemu interesu države, da na varen in točen način procesira in identificira [pridržane] osebe.
sobota, 23. maj 2015
Trdovratni podatki
Raziskovalci iz Univerze v
Cambridgeu so v raziskavi učinkovitosti funkcije resetiranja pametnega telefona
z nameščenim Android sistemom (verzije 2.3x do 4.3) nazaj na tovarniške
nastavitve (gre za funkcijo, s katero naj bi se – po splošnem prepričanju –
izbrisali prav vsi podatki in nastavitve v napravi) ugotovili, da več kot 630
milijonov telefonov podatkov dejansko ne izbriše in jih je mogoče ponovno
priklicati. Konkretneje je ocenjeno, da 500 mio telefonov ne izbriše particij z
občutljivimi podatki (npr. gesli za dostop do Gmail-a), več kot 630 mio
telefonov pa ne izbriše niti podatkov iz SD kartic, kjer so pogosto shranjene
fotografije in videoposnetki. Do podatkov se je v precejšnjem številu primerov
mogoče dokopati tudi, če je bil telefon zaščiten s šifriranjem (full-disk encryption), saj se pri
ponovni vzpostavitvi tovarniških nastavitev ključ za dešifriranje ne izbriše.
Ko prodamo, zavržemo ali drugače
upokojimo svoj pametni Android telefon, resetiranje na tovarniške nastavitve
torej ne pomeni nujno, da smo s tem uničili podatke v njem. In kaj (če sploh
kaj) lahko storimo, da kupcu ali najditelju našega pametnega telefona onemogočimo dostop do podatkov in
potencialno zlorabo? Več o tem preberite TUKAJ (link).
ponedeljek, 18. maj 2015
Barbie in Samsung TV, ki posluša
Lep prikaz "interneta stvari", ki proizvaja velike količine podatkov, zapis by Bruce Schneier v Guardian:
I realised that I had been thinking about the refrigerator backwards: it’s not a refrigerator with a computer, it’s a computer that keeps food cold. Just like that, everything is turning into a computer. Your phone is a computer that makes calls. Your car is a computer with wheels and an engine. Your oven is a computer that cooks lasagne. Your camera is a computer that takes pictures. Even our pets and livestock are now regularly chipped; my cat could be considered a computer that sleeps in the sun all day.
I realised that I had been thinking about the refrigerator backwards: it’s not a refrigerator with a computer, it’s a computer that keeps food cold. Just like that, everything is turning into a computer. Your phone is a computer that makes calls. Your car is a computer with wheels and an engine. Your oven is a computer that cooks lasagne. Your camera is a computer that takes pictures. Even our pets and livestock are now regularly chipped; my cat could be considered a computer that sleeps in the sun all day.
Surveillance is the business model of the internet for two primary reasons: people like free and people like convenient. The truth is, though, that people aren’t given much of a choice. It’s either surveillance or nothing and the surveillance is conveniently invisible so you don’t have to think about it. And it’s all possible because laws have failed to keep up with changes in business practices.
četrtek, 14. maj 2015
torek, 12. maj 2015
Pacient vas bo sedaj sprejel - kako bo mobilna tehnologija spremenila medicino
V novi prodajni uspešnici z naslovom The Patient Will See You Now: The Future of Medicine is in Your Hands, ameriški kardiolog Eric Topol podrobno analizira, kako bo demokratizacija medicinske diagnostike vplivala zdravstveni sistem. Proces spreminjanja medicine primerja z Gutenbergove iznajdbo tiska in demokratizacijo znanja, ki je shranjeno v knjigah. Že zelo kmalu bomo lahko veliko diagnostičnih testov opravili kar preko dodatkov za svoje telefone. Ti podatki nam bodo skupaj s pametnimi algoritmi v telefonih v veliko pomoč pri odločanju, kdaj dejansko je treba k pravemu zdravniki in kdaj je bolje ostati doma. Topol je kot kardiolog že prejel e-pismo s posnetkom srčnega ritma, ki mu ga je poslal pacient in ga spraševal, če ima srčni napad. Od demokratizacije medicinske diagnostike in medicinskih podatkov, kot opredeli revolucijo, bomo imeli po njegovem mnenju vsi velike koristi. Tule je posnetek predstavitve knjige v televizijski pogovorni oddaji:
četrtek, 23. april 2015
cfp. Workshop on Fairness, Accountability, and Transparency in Machine Learning
Na delavnici ICML 2015, 11. julija, Lille, Francija, o strojnem učenju ("machine learinig") bodo obravnavali ključno tematiko velikega podatkovja in algoritmičnih predikcij:
kako preprečiti vkodiranje predsodkov v avtomatizirane odločitve?
Pravni odločevalci se bodo s sistemi za pomoč pri odločanju, ki temeljijo na algoritmih, (lahko) hitro skrili za algoritem, češ “the algorithm made me do it”. Vprašanje odgovornosti za odločitve je eno izmed ključnih pri uporabi velikega podatkovja za odločitve.
Submission Deadline: May 1, 2015.
TOPICS OF INTEREST
-------------------------------
We welcome contributions on theoretical models, empirical work, and everything in between, including (but not limited to) contributions that address the following open questions:
* How can we achieve high classification accuracy while preventing discriminatory biases?
* What are meaningful formal fairness properties?
* What is the best way to represent how a classifier or model has generated a particular result?
* Can we certify that some output has an explanatory representation?
* How do we balance the need for knowledge of sensitive attributes for fair modeling and classification with concerns and limitations around the collection and use of sensitive attributes?
* What ethical obligations does the machine learning community have when models affect the lives of real people?
PAPER SUBMISSION
-----------------------------
Papers are limited to four content pages, including figures and tables, and must follow the ICML 2015 format; however, an additional fifth page containing only cited references is permitted. Papers SHOULD be anonymized. Accepted papers will be made available on the workshop website; however, the workshop's proceedings can be considered non-archival, meaning contributors are free to publish their work in archival journals or conferences. Accepted papers will be either presented as a talk or poster (to be determined by the workshop organizers).
Papers should be submitted here: https://easychair.org/conferences/?conf=fatml2015
Deadline for submissions: May 1, 2015
Notification of acceptance: May 10, 2015
ORGANIZATION
----------------------
Workshop Organizers:
Solon Barocas, Princeton University
Sorelle Friedler, Haverford College
Moritz Hardt, IBM Almaden Research Center
Joshua Kroll, Princeton University
Carlos Scheidegger, University of Arizona
Suresh Venkatasubramanian, University of Utah
Hanna Wallach, Microsoft Research NYC
petek, 17. april 2015
Računalnik NAMESTO sodnika?
Na rtvslo.si so objavili intervju z dr. Juretom Leskovcem, enem izmed najuspešnejših slovenskih znanstvenikov, ki delujejo v tujini. Naslov prispevka "Računalnik je lahko boljši od sodnika" je zavajajoč in ne povzema povsem tega, kar je Leskovec v resnici povedal.
Številne anomalije v ameriškem sistemu kaznovanja seveda kličejo po inovacijah. V sistemu, ki ga preveva rasna diskriminacija in ki (tudi) zaradi svoje togosti ustvarja primere, daleč od sodobnega pojmovanja pravičnosti, je iskanje novih rešitev najbrž nekaj temeljnega. Zadeva je šla tako daleč, da je pred časom ameriški profesor Bernard Harcourt hudomušno, a ne neresno, predlagal, da bi boljše odločitve lahko sprejemali z metom kovanca.
Leskovec pravi, da na podlagi analize dveh milijonov primerov iz ameriške sodne prakse razvijajo tehnologijo, ki bo v pomoč sodnikom pri odločanju. Odlično! Ampak:
Ta zbirka demografskih podatkov je ključ do težave ali rešitve problema. Katere podatke bomo zajeli? Kot pravi Leskovec, med njimi ne sme biti vere, barve kože in spola. Ne sme biti torej podatkov, ki bi vodili v diskriminacijo. Problem je v tem, da vsi podatki, ki o nekem posamezniku obstajajo, izvirajo iz njegovih značilnosti, ki so povezane z njegovo bitjo. Povsem utemeljena je za ameriške razmere ocena, da črnski del populacije prebiva na določenih območjih, na drugih ne. Da ima manjši delež v lasti nepremičnino, da je slabše ekonomsko situiran, da je več enostarševskih družin. Kar so vse dejavniki, ki jih program načeloma lahko upošteva, saj sami po sebi niso diskiminatorni. Diskriminatorni postanejo šele, ko med njimi najdemo skupno točko, ki temelji na rasi.
Prepričana sem, da bodo raziskovalci v Leskovčevi skupini vse omenjeno skušali kar se da upoštevati. Pomemben je tudi njegov poudarek, da gre za razvoj orodja, ki bi bil lahko v pomoč sodnikom. Tudi to je lahko sicer problematično, še posebej, kadar v igro vpelje tvegan koncept prognoze, nekoliko manj pa, ko temelji na obstoječih bazah podatkov o dosojenih primerih.
A bolj zaskrbljujoč je novinarjev naslov, ki mu dosledno sledijo tudi komentarji (seveda anonimnih) bralcev, ki si (tudi) v Sloveniji namesto sodnikov želijo več računalnikov. Kar ostaja nezapisano ali premalo poudarjeno, je dejstvo, da za vsakim računalnikom stoji človek ali skupina ljudi, ki zapiše kodo, algoritem, po katerem bo računalnik izvajal analizo. Odgovornost za odločitev s tem samo prestavimo, zabrišemo, možnosti za zlorabo pa ostajajo (le da je nevarnost tovrstne zlorabe kar sistemska in ne vezana na posamezne primere).
Kaj ste ugotovili iz analize dveh milijonov sodniških primerov? Za kakšne primere je šlo?
Sodelovali smo z ekonomisti Harvarda, Cornella in Univerze v Chicagu. Dobili smo dostop do dveh milijonov primerov iz predkazenskih postopkov. Nekdo se, recimo, stepe v baru. Primejo ga, pripeljejo pred sodnika, ta pa se mora odločiti, ali je prestopnik nevaren ali ne. Lahko ga pod varščino spusti, lahko pa ga vtakne v pripor, da tam počaka na vsebinsko sodno obravnavo. Če je nekdo v priporu, je to seveda slabo zanj in obenem slabo za družbo. Če pa ga sodnik spusti, se lahko zgodi, da ta oseba zapusti državo ali ponovi kaznivo dejanje. Tu nastopi vprašanje, ali bi lahko sodnikom kakor koli pomagali k boljšemu odločanju.
Analiza nam je prinesla dve zanimivi ugotovitvi. Prva: objektiven program deluje 60 odstotkov bolje kot sodniki v ZDA. Razlika nastane v tem, da lahko program v nasprotju s človeškim sodnikom natančno analizira dva milijona sodnih primerov in najde vzorce v lastnostih prestopnikov, ki so povezani z negativnim obnašanjem v prihodnosti. Druga: analize kažejo, da se človek preveč osredini na osebne karakteristike. Program ima namreč dostop samo do kartoteke osumljenca. Sodnik osebo še vidi in pri presoji uporablja neka dodatna merila, ki ga vodijo v neoptimalne odločitve. To še delamo, a vsi, ki so videli dozdajšnje rezultate, so bili kar navdušeni in jih je zadeva zelo zanimala. Kmalu bomo delo objavili. Treba pa je poudariti, da ideja ni, da bi računalniki zamenjali ljudi, ampak kako lahko računalniki in ljudje skupaj sprejemajo boljše odločitve.
vir: http://cs.stanford.edu |
Številne anomalije v ameriškem sistemu kaznovanja seveda kličejo po inovacijah. V sistemu, ki ga preveva rasna diskriminacija in ki (tudi) zaradi svoje togosti ustvarja primere, daleč od sodobnega pojmovanja pravičnosti, je iskanje novih rešitev najbrž nekaj temeljnega. Zadeva je šla tako daleč, da je pred časom ameriški profesor Bernard Harcourt hudomušno, a ne neresno, predlagal, da bi boljše odločitve lahko sprejemali z metom kovanca.
Leskovec pravi, da na podlagi analize dveh milijonov primerov iz ameriške sodne prakse razvijajo tehnologijo, ki bo v pomoč sodnikom pri odločanju. Odlično! Ampak:
Nekdo ima kartoteko, drugi je nima. Podatki so od človeka do človeka različno dostopni. Kje so omejitve uporabnosti te metode - le na ljudeh s kriminalno preteklostjo?
Ne nujno. Veliko stvari se lahko vprašaš. Koliko časa nekdo živi na istem naslovu? Ima nepremičnino v lasti ali plačuje najemnino? Ima mobilni telefon? Veliko je demografskih podatkov. Sicer med njimi ne sme biti vere, barve kože in spola. Socialno-demografska kartoteka je zelo velika in kriminalna kartoteka sploh ni nujna. Čeprav je v realnosti velik del teh ljudi povratnikov.
Ta zbirka demografskih podatkov je ključ do težave ali rešitve problema. Katere podatke bomo zajeli? Kot pravi Leskovec, med njimi ne sme biti vere, barve kože in spola. Ne sme biti torej podatkov, ki bi vodili v diskriminacijo. Problem je v tem, da vsi podatki, ki o nekem posamezniku obstajajo, izvirajo iz njegovih značilnosti, ki so povezane z njegovo bitjo. Povsem utemeljena je za ameriške razmere ocena, da črnski del populacije prebiva na določenih območjih, na drugih ne. Da ima manjši delež v lasti nepremičnino, da je slabše ekonomsko situiran, da je več enostarševskih družin. Kar so vse dejavniki, ki jih program načeloma lahko upošteva, saj sami po sebi niso diskiminatorni. Diskriminatorni postanejo šele, ko med njimi najdemo skupno točko, ki temelji na rasi.
Prepričana sem, da bodo raziskovalci v Leskovčevi skupini vse omenjeno skušali kar se da upoštevati. Pomemben je tudi njegov poudarek, da gre za razvoj orodja, ki bi bil lahko v pomoč sodnikom. Tudi to je lahko sicer problematično, še posebej, kadar v igro vpelje tvegan koncept prognoze, nekoliko manj pa, ko temelji na obstoječih bazah podatkov o dosojenih primerih.
A bolj zaskrbljujoč je novinarjev naslov, ki mu dosledno sledijo tudi komentarji (seveda anonimnih) bralcev, ki si (tudi) v Sloveniji namesto sodnikov želijo več računalnikov. Kar ostaja nezapisano ali premalo poudarjeno, je dejstvo, da za vsakim računalnikom stoji človek ali skupina ljudi, ki zapiše kodo, algoritem, po katerem bo računalnik izvajal analizo. Odgovornost za odločitev s tem samo prestavimo, zabrišemo, možnosti za zlorabo pa ostajajo (le da je nevarnost tovrstne zlorabe kar sistemska in ne vezana na posamezne primere).
Naročite se na:
Objave (Atom)