Pravo v dobi velikega podatkovja: 2015

sreda, 16. december 2015

Sprejet dogovor o novih ureditvi varstva osebnih podatkov v EU po 4 letih usklajevanj

Po slabih 4 letih usklajevanj je bil le sprejet politični dogovor, da se sprejme paket varstva osebnih podatkov prilagojen internetni dobi, tj. dva akta, Splošna uredba o varstvu podatkov in Direktiva o varstvu podatkov za policijske organe in organe kazenskega pravosodja. Besedila še ni, osnovni parametri pa so znani. Države bodo nato imele še 2 leti časa, da nadomestijo preživeto Direktivo 95/46/ES z dne 24. oktobra 1995.

EDPS objavil novo analizo izzivov velikega podatkovja (nov. 2015)

Evropski nadzornik za varstvo osebnih podatkov (EDPS) je objavil obsežnejše mnenje o izzivih in tveganjih velikega podatkovja. Tveganja so: - Lack of transparency - Informational imbalance - The risk of core principles of data protection - The risks related to predictions and the a risk of a ‘dictatorship of data’ - Unfair and discriminatory conclusions - Social and cultural segregation and exclusion Več v mnenju.

torek, 15. december 2015

SODBA EVROPSKEGA SODIŠČA ZA ČLOVEKOVE PRAVICE ZAKHAROV PROTI RUSIJI, 47143/06

Pred kratkim je veliki senat Evropskega sodišča za človekove pravice soglasno sprejel odločitev, da je prišlo do kršitve pravice do zasebnosti in družinskega življenja iz 8. člena konvencije v primeru Zakharov proti Rusiji.

Sodišče se je v tem primeru ukvarjalo s prestrezanjem komunikacij med mobilnimi telefoni v Rusiji. Pritožnik je bil urednik založniškega podjetja. Na sodišče je vložil pritožbo zaradi ruske zakonodaje, ki od mobilnih operaterjev zahteva, da morajo omogočiti pravosodnim organom, da le-ti izvajajo operativne aktivnosti, ki omogočajo blanketno prestrezanje komunikacij brez zadostnih zakonskih varovalk.

Čeprav pritožnik ni mogel dokazati, da je bil žrtev konkretnega ukrepa, mu je sodišče priznalo status žrtve. Zaradi pomanjkanja pravnih sredstev v nacionalnem sistemu, prikrite narave prikritih teh ukrepov in zato, ker so ti ukrepi prizadeli vse uporabnike mobilnih komunikacij, se je sodišče odločilo, da ne bo presojalo relevantne ruske zakonodaje zgolj z vidika konkretnega nadzora, kateremu je bil podrejen pritožnik, ampak z abstraktnega vidika. Poleg pritožniku ni treba niti dokazati, da je obstajalo tveganje, da bi bila njegova komunikacija nadzorovana.

Ker nacionalna zakonodaja ne omogoča učinkovitega pravnega sredstva osebi, ki sumi, da se zoper njo izvaja prikrito prestrezanje komunikacij, sam obstoj zakonodaje, ki tak poseg omogoča, predstavlja poseg v pravico do zasebnosti po osmem členu konvencije. Tak poseg sicer lahko zasleduje legitimni cilj zaščite nacionalne in javne varnosti, preprečevanja kriminalitete in zaščite ekonomske blaginje države, toda glede na to, da tak sistem prikritega nadzora z namenom zaščite nacionalne varnosti lahko spodkoplje ali celo uniči demokracijo, se je sodišče moralo prepričati, da v ruski zakonodaji obstajajo primerne in učinkovite varovalke zoper zlorabo tega sistema.

Prav v zvezi s tem pa je sodišče pomenljivo zaključilo, da ruska zakonodaja o prestrezanju komunikacij ne zagotavlja primernih in učinkovitih garancij zoper arbitrarnost in zoper tveganje zlorab, ki je inherentno vsakemu sistemu prikritega nadzora in ki je še posebej visoko v sistemih, kakršen je v Rusiji, kjer imajo obveščevalne službe in policija s tehničnimi sredstvi neposreden dostop do vseh mobilnih telekomunikacij.

Še posebej pa je sodišče izpostavilo naslednje pomanjkljivosti ruske ureditve; okoliščine, v katerih je v Rusiji mogoče odrediti prikrit nadzor, trajanje takih ukrepov, okoliščine, v katerih jih je treba prenehati izvajati, postopek odreditve prestrezanja komunikacij, kot tudi shranjevanje in uničevanje pridobljenih podatkov ter nadzor nad prestrezanjem komunikacij.

Učinkovitost pravnih sredstev za izpodbijanje prestrezanja komunikacij je še posebej zmanjšana zato, ker so na voljo zgolj osebam, ki lahko dokažejo, da so bile žrtve prestrezanja komunikacij, tak dokaz pa je probatio diabolica, glede na odsotnost kakršnega koli sistema obveščanja o izvajanju ukrepov ali možnosti dostopanja do podatkov o prestrezanju komunikacij.

četrtek, 10. december 2015

Temačni del interneta (the darknet)

Sredi devetdesetih let 20. stoletja se je majhna raziskovalna skupina mornariškega laboratorija pod vodstvom matematika Paula Syversona lotila novega ambicioznega raziskovalnega projekta. Razviti so želeli tehnologijo, ki bi ljudem omogočala, da bi postali nevidni. Vendar ne na način, da jih ne bi bilo mogoče opaziti v resničnem svetu, temveč da bi bili nevidni oziroma bolje rečeno anonimni v navidezni realnosti interneta. Vojska, obveščevalne službe in diplomati so želeli, da raziskovalci iznajdejo tehniko, ki bi jim omogočala, da bi lahko od koderkoli na svetu po internetu pošiljali in sprejemali informacije, ne da bi pri tem razkrili svojo pravo identiteto.

Običajni uporabniki interneta imamo pogosto napačen vtis, da se anonimno in nevidno sprehajamo po spletnih straneh, prenašamo datoteke in pišemo komentarje po forumih. V resnici dobi vsakdo, ki se poveže v internet, svojo identifikacijsko številko (IP-naslov), ki ga ves čas spremlja. Tudi če z lažnim imenom objavljamo protivladne komentarje, nas bodo organi pregona v državi, ki ne pozna svobode govora, brez težav našli preko našega IP-naslova.

Raziskovalce je zato zanimalo, kako bi omogočili anonimnost uporabnikom interneta, če morajo ti obvezno uporabljati IP-naslove, saj brez njih internet ne deluje. Domislili so se, da bi visoko stopnjo anonimnosti lahko dosegli s pomočjo mreže računalnikov, med katerimi bi potovali podatki, preden bi dosegli želeni cilj. Metodo si najlažje predstavljamo s preprosto prispodobo. Namesto da bi si žogo dve osebi izmenjevali z neposrednimi podajami, ki jih lahko vsi vidijo, prva oseba na žogo napiše ime osebe, ki bi ji žogo rada podala, nato pa jo vrže v množico, ki si žogo nekaj časa podaja v naključnem zaporedju. Po določenem številu takšnih naključnih izmenjav žoga iz množice odleti k osebi, ki ji je namenjena.

Pošiljatelj in naslovnik bi si lahko tako preko interneta izmenjala informacije, ne da bi mogli opazovalci dogajanja ugotoviti, kdo dejansko medsebojno komunicira. Zakodirani paket z informacijo bi potoval po mreži in izstopil na povsem naključnem mestu, tako da iz zadnje »podaje« ne bi mogli sklepati, kdo je dejansko informacijo poslal na pot.

Metodo so poimenovali the onion routing ali s kratico tor. Ker pa so potrebovali veliko mrežo neodvisnih računalnikov, med katerimi bi si podajali pakete, da bi se sled naposled izgubila, projekta niso mogli zadržati v tajnosti, ampak so ga leta 2004 odprli za javnost. Da bi sistem sploh lahko deloval tudi za vohune in diplomate, so morali vanj vključiti čim več uporabnikov, ki so služili za vmesnike pri naključnih »podajah«. Danes lahko omrežje tor uporabljamo preprosto tako, da si preko spletne strani www.torproject.org prenesemo brskalnik tor, ki je na voljo za računalnike, tablice in pametne telefone. Ko se zažene, se poveže v omrežje tor in nam omogoča, da po internetu brskamo anonimno.

Omrežje tor ne omogoča anonimnosti le uporabnikom interneta, temveč tudi spletnim stranem. Enako kot ljudje, ki brskajo po internetu, imajo svoje IP-naslove, preko katerih jih lahko identificiramo, tudi spletni strežniki. Podobno kot se lahko z omrežjem tor v anonimnost skrijejo uporabniki interneta, se lahko skrijejo tudi ustvarjalci spletnih strani. S pomočjo brskalnika tor lahko obiskujemo tudi spletne strani s končnico .onion, identiteta avtorjev katerih ni nujno znana. To so lahko povsem običajne spletne strani, kot je denimo spletna stran facebook.onion, ki omogoča alternativni dostop do facebooka, lahko pa so njihovi avtorji kriminalne združbe, ki se želijo preko anonimnosti skriti pred kazenskim pregonom.

Najbolj slavno spletno stran na temačnem delu interneta (the darknet), kot pravijo spletnim stranem, ki jih z iskalniki, kot je denimo google, ne moremo najti, je leta 2011 postavil neznanec z vzdevkom Altoid. Prišel je na idejo, da bi vzpostavil spletno tržnico za preprodajo blaga, s katerim trgovanje ni dovoljeno. Na prvi pogled je šlo za dokaj običajno spletno trgovino, kjer si lahko prebral recenzije in ocene posameznega izdelka in se odločil za nakup, plačal z valuto bitcoin, paket z naročenim blagom pa dobil čez nekaj dni po pošti. Vendar se preko te spletne strani ni trgovalo z običajnimi izdelki, ampak s prepovedanimi drogami in orožjem, menda pa si lahko najel celo morilca.

Altoid je vzpostavil anonimno tržnico, poimenovano silk road, in pobiral odstotke od vsake kupčije, ki so jo denimo dobavitelji drog sklenili s svojimi strankami. Posel je cvetel, dokler niso kljub pazljivosti avtorja ilegalne spletne trgovine v začetku oktobra 2013 aretirali agenti FBI v javni knjižnici v San Franciscu. S trikom jim ga je uspelo prijeti celo s prižganim prenosnim računalnikom, kar je olajšalo dokazni postopek na sodišču. Leta 1984 rojeni Ross Ulbricht, kot je bilo avtorju spletne strani silk road dejansko ime, je bil februarja 2015 obsojen na dosmrtno ječo brez možnosti, da kadarkoli zaprosi za predčasni izpust iz zapora. Vendar se je na temačnem internetu že kmalu po razkrinkanju in aretaciji avtorja prve verzije pojavila nova različica spletne prodajalne drog.

Več: Rojstvo temačnega interneta

sobota, 21. november 2015

Snowden nas pouči, kako ohraniti zasebnost na internetu

Nekaj navodil za običajne uporabnike interneta:

The first step that anyone could take is to encrypt their phone calls and their text messages. You can do that through the smartphone app Signal, by Open Whisper Systems. It’s free, and you can just download it immediately. And anybody you’re talking to now, their communications, if it’s intercepted, can’t be read by adversaries. [Signal is available for iOS and Android, and, unlike a lot of security tools, is very easy to use.]
You should encrypt your hard disk, so that if your computer is stolen the information isn’t obtainable to an adversary — pictures, where you live, where you work, where your kids are, where you go to school. [I’ve written a guide to encrypting your disk on Windows, Mac, and Linux.]
Use a password manager. One of the main things that gets people’s private information exposed, not necessarily to the most powerful adversaries, but to the most common ones, are data dumps. Your credentials may be revealed because some service you stopped using in 2007 gets hacked, and your password that you were using for that one site also works for your Gmail account. A password manager allows you to create unique passwords for every site that are unbreakable, but you don’t have the burden of memorizing them. [The password manager KeePassX is free, open source, cross-platform, and never stores anything in the cloud.]
The other thing there is two-factor authentication. The value of this is if someone does steal your password, or it’s left or exposed somewhere … [two-factor authentication] allows the provider to send you a secondary means of authentication — a text message or something like that. [If you enable two-factor authentication, an attacker needs both your password as the first factor and a physical device, like your phone, as your second factor, to login to your account. Gmail, Facebook, Twitter, Dropbox, GitHub, Battle.net, and tons of other services all support two-factor authentication.] ...
I think Tor is the most important privacy-enhancing technology project being used today. I use Tor personally all the time. We know it works from at least one anecdotal case that’s fairly familiar to most people at this point. That’s not to say that Tor is bulletproof. What Tor does is it provides a measure of security and allows you to disassociate your physical location. …

Tor Browser

run your own Tor node

Vir: Edward Snowden Explains How To Reclaim Your Privacy

Why Machines Discriminate—and How to Fix Them

"Številke govorijo same zase", gre pregovorna modrost. Vendar raziskovalka Crawford opoozarja: "...big data sets can perpetuate the same biases present in our culture". Po drugi strani pa pregovorni "algoritmi delajo, kar jim ukažemo", tudi ne drži povsem: "the decisions that machine-learning algorithms spit out are a lot more complicated and opaque than people think..., which makes tracking down an offending line of code a near impossibility." Predavanje dostopno.

ponedeljek, 12. oktober 2015

Ste pripravljeni na »big data«?

Na letošnjem Statističnem dnevu bodo o potencialu masivnih podatkov razpravljali priznani tuji in domači strokovnjaki.

10. november 2015 na Brdu pri Kranju

Udeležba je brezplačna.

Več tu.

nedelja, 11. oktober 2015

Malo in veliko podatkovje

Pojem malo podatkovje (little data) se uporablja za opis podatkov, ki jih o posamezniku zbirajo razni senzorji v okolici, na telesu ali v njegovem pametnem telefonu. Ključno za to označbo je, da se podatki navezujejo na enega samega konkretnega človeka. To so lahko na primer lokacijski podatki s telefona ali navigacijske naprave za več let nazaj, podatki senzorja srčnega utripa, ki ga uporabljamo med tekom, ali pa zgolj informacije, kdaj smo vstali in kdaj gremo spat, kar lahko naš telefon tudi dokaj učinkovito in vestno beleži. Seveda je takšnih informacij vsako leto več, saj količina najrazličnejših senzorjev, ki jih vsakodnevno uporabimo, hitro raste.

Pojem malo podatkovje se od pojma veliko podatkovje (big data) razlikuje po tem, da se prvi nanaša na konkretnega posameznika, medtem ko drugi označuje podatke, ki so zbrani na osnovi opazovanja velike množice ljudi. Obema pa je skupna želja, da bi na osnovi velike količine meritev prišli do informacij o delovanju ljudi, ki niso očitne in se jih praviloma sploh ne zavedamo.

Razliko med velikim in malim podatkovjem lahko opredelimo tudi preko tega, kaj želimo z njimi doseči. Malo podatkovje služi predvsem posameznikom pri doseganju osebnih ciljev, medtem ko veliko podatkovje omogoča velikim organizacijam v obliki korporacij in držav, da uresničujejo svoje specifično poslanstvo, ki ni nujno v soglasju z interesi posameznikov.

Več o tej temi:
Industrija sreče - Kvarkadabra
Industrija sreče: Kmalu bomo vedeli, kako človeka narediti srečnega | Dnevnik

petek, 2. oktober 2015

Sérvulo & Associados - Sociedade de Advogados, RL proti Portugalski

Evropsko sodišče za človekove pravice je v začetku septembra sprejelo zanimivo odločitev Sérvulo & Associados - Sociedade de Advogados, RL proti Portugalski. Pritožnika je predstavljala odvetniška pisarna in v njej zaposleni odvetniki. Na Portugalskem je bila namreč sprožena kazenska preiskava zaradi suma korupcije in pranja denarja v zvezi s portugalskim nakupom dveh podmornic od Nemčije zoper sedem portugalskih in nemških državljanov, vključno zoper odvetnika, ki je delal v imenu pritožnika. Izdana je bila sodna odredba za preiskavo prostorov omenjene odvetniške pisarne in za zaseg relevantnih predmetov. Preiskovalni sodnik je odobril tudi zaseg elektronskih podatkov na podlagi 35 ključnih besed, kot sta na primer finančni prispevek, financiranje. Že pred izvedbo hišne preiskave se je pritožnik pritožil, da so izbrane ključne besede preveč splošne, da jih pisarna pogosto uporablja in bi zato njihova uporaba vodila k nesorazmernemu zasegu dokumentov, ki so nerelevantni za preiskavo in pokriti s poklicno skrivnostjo. Preiskovalni sodnik je odobril pritožbi in odredil zapečatenje zaseženih predmetov. Pritožbeno sodišče je zavrnilo pritožbo, preiskovalni sodnik je zaukazal uničenje 850 dokumentov z osebni podatki ali poklicno skrivnostjo, preiskava pa je bila ustavljena.

Sodišče je pritožbo obravnavalo z vidika osmega člena konvencije in ugotovilo, da portugalski Zakon o kazenskem postopku ter Statut odvetniške zbornice zagotavljata postopkovne varovalke glede hišne preiskave in zasega predmetov v odvetniških pisarnah in da so bile vse te varovalke spoštovane v konkretnem primeru. Vsi pritožniki so bili prisotni med hišno preiskavo, vključno s predstavnikom Odvetniške zbornice. Preiskovalni sodnik je tudi nadzoroval dejanja ter tako deloval v vlogi sodnika garanta pred, med in po dejanju. Predvsem pa je Evropsko sodišče za človekove pravice izpostavilo garantno vlogo sodišč v tem primeru. Preiskovalni sodnik je tisti, ki je odločil, kateri dokument je relevanten za preiskavo in kateri ne, in je posledično zahteval uničenje 850 dokumentov, ki so bili zaščiteni kot osebni podatki, poklicna skrivnost ali pa so bili očitno nerelevantni za primer. Evropsko sodišče je še odločilo, da država ni dolžna vračati kopij podatkov, le originale, kar pa je že storila. Na podlagi spoštovanja v zakonu predpisanih varovalk, ki so tudi v konkretnem primeru preprečile zlorabe in arbitrarnost, je zato ugotovilo, da poseg v zasebnost iz osmega člena konvencije ni bil nesorazmeren in da osmi člen posledično ni bil kršen.

Odločitev je relevantna tudi za slovensko ureditev, saj je trenutno pred Ustavnim sodiščem odprta presoja ustavnosti in odločanje o ustavni pritožbo zaradi izvedenih hišnih preiskav in preiskav elektronskih naprav pri odvetnikih, a za razliko od portugalske ureditve trenutna slovenska ureditev in praksa dajeta manj poudarka sodni kontroli dejanj.

torek, 29. september 2015

Kaj nam veliko podatkovje lahko pove o beguncih?

Ta kratki filmček na kratko opiše, kaj uporabniki sirskega googla iščejo na spletu. Nekatera njihova iskanja so razmeroma pričakovana - "Imigracija v Nemčijo" in "Azil v Nemčiji", "Madžarska in begunci", zemljevidi in razdalje med kraji, ki jih morajo prepotovati na poti v obljubljeno deželo.

Manj pričakovana in najbrž še bolj boleča so iskanja tistih, ki ostajajo doma: "Rdeči križ Sirija", "Kako doma oskrbeti opekline", "Oživljanje usta na usta" in podobno.

Podatki, ki dajejo neverjetno dobro sliko o dogajanju v sedanjosti, pa lahko pridejo prav tudi pri napovedovanju prihodnjih dogodkov - glede na iskalne pojme, pravijo avtorji posnetka, ni pričakovati zmanjšanja begunskega eksodusa is Sirije.

ponedeljek, 28. september 2015

Algorithmic storytelling

Zanimiv projekt, ki se je začel že pred 10 leti: pobrati vse stavke na spletu, ki vsebujejo sintagmo: "čutim" ("I feel" in "I am feeling"). Tako lahko primerjamo:

- ali se Evropejci počutijo bolj žalostne od Amerosov?

- ali se ženske počutijo pogosteje debele kot moški?

- kakšna so najbolj reprezentativna občutja 30-letnic v New Yorku?

- kako se ljudje počutijo v Bagdadu?

Zdaj pa si zamislimo manj "nedolžno" idejo in kako bi to lahko delovalo pri drugačnih "sentiment analizah" varnostnih organov.

O metodi:

At the core of We Feel Fine is a data collection engine that automatically scours the Internet every ten minutes, harvesting human feelings from a large number of blogs. Blog data comes from a variety of online sources, including LiveJournal, MSN Spaces, MySpace, Blogger, Flickr, Technorati, Feedster, Ice Rocket, and Google.

We Feel Fine scans blog posts for occurrences of the phrases "I feel" and "I am feeling". This is an approach that was inspired by techniques used in Listening Post, a wonderful project by Ben Rubin and Mark Hansen.

Once a sentence containing "I feel" or "I am feeling" is found, the system looks backward to the beginning of the sentence, and forward to the end of the sentence, and then saves the full sentence in a database.

O rezultatih:

The result is a database of several million human feelings, increasing by 15,000 - 20,000 new feelings per day. Using a series of playful interfaces, the feelings can be searched and sorted across a number of demographic slices, offering responses to specific questions like...

Več na:

http://wefeelfine.org/methodology.html

sreda, 2. september 2015

PREDLOG NOVELE ZAKONA O NALOGAH IN POOBLASTILIH POLICIJE

V avgustu je slovenska Policija kot delovno gradivo predstavila osnutek spremembe Zakona o nalogah in pooblastilih policije.[1] Predlog posega tudi na področje posegov v zasebnost, zato velja predstaviti določene predloge sprememb.

Najprej velja omeniti spremembo 11. člena zakona, ki se zdi zgolj tehnična, saj naj bi se izraz kriminalistično pridobivanje in vrednotenje informacij spremenil v kriminalistično obveščevalno dejavnost. A je treba to spremembo verjetno povezati tudi z bolj daljnosežnimi spremembami 23. in 24. člena zakona, ki govorita o prirejeni identiteti tajnih delavcev. Trenutno besedilo predloga namreč omogoča ustvarjanje prirejene identitete tudi pred samo izvedbo prikritega preiskovalnega ukrepa, a povsem neomejeno glede na čas trajanja, povezavo z določeno zadevo, osebo, akcijo, itd.

Omeniti velja tudi potencialno širitev varnostnega pregleda na ustno votlino,[2] ter zniževanje standardov za opravljanje pregleda osebe po 52. členu Zakona o nalogah in pooblastilih policije. Temeljna pogoja, da se je to pooblastilo sploh uvedlo v zakon (neposredna zaznava policista, da ima oseba pri sebi predmete, ki jih je treba zaseči, ter velika verjetnost za posest teh predmetov), se znižujeta. Dovolj naj bi bila verjetnost posesti prepovedanega predmeta, policist pa bi to lahko ugotavljal ne samo na podlagi neposredne zaznave, ampak tudi na podlagi ugotovljenih dejstev in okoliščin.

Z vidika zasebnosti je zanimiv tudi predlog Policije, da bi pri nadzoru cestnega prometa na javnih cestah in drugih javnih površinah smeli uporabljati tehnična sredstva za optično prepoznavo registrskih tablic z namenom ugotavljanja pogojev za udeležbo voznika in vozila v cestnem prometu ter iskanja oseb in predmetov.[3]

Tudi pri uporabi tehničnih sredstev pri izvajanju policijskih pooblastil in spremljanju javnih zbiranj naj bi prišlo do sprememb. Policija pri tem skuša bolj natančno opredeliti meje pooblastila; način njihove uporabe oziroma njihove nosilce. Tako naj bi se ta tehnična sredstva (ki naj bi vključevala tudi drone) uporabljala neposredno, iz vozila, plovila, zrakoplova, iz zgradb ali drugih objektov, po trenutnem predlogu pa naj bi obstajala tudi možnost uporabe tehničnih sredstev, ki so v lasti drugih državnih organov in pravnih oseb.[4]

[1] Uradni list RS, št. 15/13 in 23/15 – popr..

[2] 51. člen zakona.

[3] 113/IV člen zakona.

[4] 114/V, VI člen zakona.

ponedeljek, 31. avgust 2015

Posnetek predavanja Jureta Leskovca na kolokviju Pravo v dobi velikega podatkovja

Več podatkov o kolokviju: Inštitut za kriminologijo: Pravo v dobi velikega podatkovja: Ali lahko računalnik sodi bolje kot sodnik?

nedelja, 30. avgust 2015

kolokvij

PRAVO V DOBI VELIKEGA PODATKOVJA:

Ali lahko računalnik sodi bolje kot sodnik?

31.avgust 2015 ob 12. uri

Pravna fakulteta Univerze v Ljubljani

(Zlata predavalnica)

Plenarno predavanje:

doc. dr. Jure Leskovec, Univerza Stanford (ZDA)

Več tu.

ponedeljek, 24. avgust 2015

Postdoc o negotovostih velikega podatkovja, Univerza v Kopenhagnu

Big data archives offer themselves as reassuring, neutral and innovative systems for the oversight of today’s information deluge. Yet recent information scandals suggest that big data entail not only big possibilities, but also a considerable range of uncertainties.
Več na strani univerze.

ponedeljek, 17. avgust 2015

Algoritem, ki napove sodbo sodišča

Tule je povezava na članek Algoritem, ki napove sodbo sodišča, ki govori o zgodovini moralne statistike in nekaterih sodobnih aplikacijah velikih podatkov na medicino in pravo. Odlomek iz članka:

Vplivni ameriški pravni teoretik Richard Posner je nekoč, ko je bil še mlajši sodnik, obravnaval spor glede patenta za avtomatsko izbiranje televizijskih kanalov na osnovi gledalčevih preferenc. Izbor kanalov naj bi potekal na podoben način, kot nam denimo Amazon priporoča nove knjige ali Netflix zanimive filme. Algoritmi na osnovi naših preteklih ogledov, iskanj in nakupov presodijo, za katera dela obstaja velika verjetnost, da nam bodo všeč, in nam jih priporočijo. Posner je ob spremljanju argumentov med sojenjem pomislil, da bi lahko na podoben način, z avtomatsko analizo vsega, kar je posamezni sodnik kdajkoli napisal in izrekel, z veliko verjetnostjo napovedovali tudi, kako bo sodnik odločil v primeru, ki ga trenutno obravnava.
Nekaj podobnega so dejansko preizkusili v študiji The Supreme Court Forecasting Project leta 2004, ko je algoritmu uspelo pravilno napovedati kar 75 odstotkov razsodb ameriškega vrhovnega sodišča, medtem ko je ekspertni skupini pravnikov, ki je prav tako poskušala napovedati odločitve v istem časovnem obdobju, to uspelo le v 59 odstotkih primerov. Grenko spoznanje ob tej študiji je bilo, da so tudi najbolj ugledni in učeni sodniki pri odločanju močno podvrženi svojim ideološkim preferencam ali predsodkom. Čeprav naj v idealnem svetu podatek, ali je sodnik v preteklosti volil republikance ali demokrate, ne bi smel predvideti njegovega sojenja, je bila prav ločnica med konservativnim in liberalnim svetovnim nazorom pomemben parameter, ki ga je uporabljal algoritem (Več: Algoritem, ki napove sodbo sodišča)

petek, 24. julij 2015

M.N. IN DRUGI PROTI SAN MARINU (2015)

V začetku julija je veliki senat Evropskega sodišča za človekove pravice sprejelo zanimivo in aktualno sodbo s področja varstva zasebnosti, in sicer v zadevi M.N. in drugi proti San Marinu (28005/12, http://hudoc.echr.coe.int/eng#{"itemid":["001-155819"]} ). Sodišče je ugotovilo kršitev pravice do varstva zasebnosti osmega člena konvencije v primeru pritožnika M.N..

Pred letom 2009 je Italija sprožila več kazenskih postopkov v zvezi s pranjem denarja, zlorabo položaja pri trgovanju s finančnimi inštrumenti, itd., a ne zoper pritožnike. S temi kaznivimi dejanji naj bi bilo povezano tudi podjetje San Marino Investimenti S.A., katerega delnice naj bi bile uporabljene pri spornih finančnih operacijah. Italijanski državni tožilec je zaprosil San Marino za pomoč pri pridobivanju dokumentacije in pri izvedbi hišnih preiskav pri finančnih inštitucijah v San Marinu. Sodišče v San Marinu je tako odobrilo preiskavo vseh bank, ficuiarjev ter skladov v San Marinu z namenom pridobiti podatke o računih, ki bi jih bilo mogoče povezati s San Marino Investimenti S.A.. V sklopu teh preiskav je bila zasežena tudi bančna dokumentacija pritožnikov, čeprav sami niso bili predmet kazenskega postopka, in pritožniki so po izčrpanih notranjih pravnih sredstvih vložili pritožbo na Evropsko sodišče za človekove pravice zaradi kršitve osmega člena konvencije.

Sodišče je odločilo, da gre v primeru bančnih podatkov za osebne podatke, ki se nanašajo na posameznika, ne glede na to, ali vsebujejo občutljive podatke ali ne in ne glede na to, kdo je lastnik nosilca podatkov. Bančni podatki so zato zaščiteni z osmim členom konvencije oziroma s terminom zasebnost. Relevantna pa je tudi zaščita dopisovanja, saj je zaseg predmetov obsegal tudi pisma in elektronsko pošto (par. 51-55).

Zaseg, kopiranje in branje takih podatkov zato predstavlja poseg v osmih člen konvencije, ki ga je nacionalno pravo omogočalo tudi v razmerju do tretjih oseb, ki niso stranka kazenskega postopka (načelo zakonitosti), ta poseg pa je zasledoval legitimni cilj (prevencija kaznivih dejanj, zaščita pravic drugih in ekonomske blaginje) (par. 74, 75).

Sodišče je odločilo, da poseg ni bil nujen v demokratični družbi, ker ni omogočal učinkovitih procesnih garancij. M.N., ki ni bil obdolžen nobenega kaznivega dejanja, pa tudi ne lastnik bančnih institutov, ni mogel po pravu San Marina kasneje izpodbijati zakonitost preiskave, zasega, kopiranja in kasnejše hrambe informacij iz dokumentacije, ki se je nanašala nanj. Ker ni bil obdolžen kaznivega dejanja, je bil v primerjavi z obdolžencem v precej slabšem procesnem položaju, zato ni bil deležen učinkovite zaščite po nacionalnem pravu. Sodišče je ob tem še posebej poudarilo, da je pomanjkanje pravne zaščite oziroma možnosti za izpodbijanje dejanj še toliko bolj relevantno, ker je bila preiskava izvršena na državni ravni in so bile dejansko preiskane vse finančne inštitucije v San Marinu, torej je bilo oseb, proti katerim je bil izvršen poseg v zasebnost, hkrati pa tudi oseb, ki niso smele po pravu San Marina kasneje izpodbijati to dejanje, mnogo (par. 78-85), pravzaprav več kot obdolžencevv

Izsledke tega primera lahko apliciramo tudi na slovensko zakonodajo. Slovenski Zakon o kazenskem postopku ravno tako omogoča poseg v bančno tajnost tretjih oseb, za katere je mogoče utemeljeno sklepati, da so udeležene v finančnih transakcijah ali poslih osumljenca ali obdolženca, če bi ti podatki utegnili biti dokaz v kazenskem postopku ali če so potrebni zaradi zasega predmetov ali zavarovanja zahtevka za odvzem premoženjske koristi oziroma premoženja v vrednosti premoženjske koristi (156. člen). Te osebe pa nimajo možnosti zahtevati ekskluzije dokazov, pritožbe zoper odredbo preiskovalnega sodnika ali kasnejšo (obsodilno) sodbo, ne morejo tudi vlagati izrednih pravnih sredstev. Lahko pa se seznanijo z vsebino tako pridobljenih podatkov pred njihovim uničenjem, če se kazenski pregon ne sproži (154. člen), ali pa vložijo upravni spor v skladu z zakonom. A po mnenju Evropskega sodišča za človekove pravice tako ali podobno sredstvo praviloma ne šteje za učinkovito pravno sredstvo (par. 81).

četrtek, 23. julij 2015

Veliko podatkovje v znanosti

Štiri zgodbe o tem, kako veliko podatkovje spreminja znanstveno-raziskovalno delo, piše Guardian.

nedelja, 21. junij 2015

Različni pogledi na »veliko DNK podatkovje«

Znano je, da je Ustavno sodišče Republike Slovenije v začetku leta 2014 kot neskladno z Ustavo razglasilo prvo alinejo prvega odstavka 63. člena Zakona o policiji, ki je omogočala, da so se lahko profili odvzetih vzorcev DNK oseb, ki so bile osumljene, niso pa bile pravnomočno obsojene za očitano kaznivo dejanje, hranili vse do zastaranja kazenskega pregona, in sicer za namen odkrivanja storilca kaznivega dejanja oziroma zaradi ugotavljanja njegove istovetnosti (odločba US RS je dostopna TUKAJ). Ameriško Vrhovno sodišče pa je malce pred tem (sredi leta 2013) v zadevi Maryland v. King odločilo drugače oziroma smiselno potrdilo, da Zakon o zbiranju DNK zvezne države Maryland ni ustavno sporen.

Policija ameriške zvezne države Maryland je leta 2009 pridržala Alonza J. Kinga zaradi naklepnega ogrožanja varnosti druge osebe. Kasneje je bila obtožba za kaznivo dejanje umaknjena, King pa je bil kaznovan le za prekršek. Ob aretaciji je policija skladno z Zakonom o zbiranju DNK vzela vzorec Kingove njegove sline zaradi analize DNK. Ko je bila njegova DNK vnesena v bazo podatkov, se je pokazalo ujemanje z vzorcem DNK storilca do takrat še nerazrešenega posilstva iz leta 2003. Posledično je bil King obtožen in na prvi stopnji tudi obsojen za kaznivo dejanje posilstva, ki ga je izvršil v letu 2003. Pritožbeno sodišče je nato sodbo odpravilo, saj je ocenilo, da je bil odvzem sline zaradi pridobitve DNK v konkretnem primeru nerazumna in posledično neustavna preiskava, ker je bilo Kingovo pričakovanje zasebnosti večje od interesa zvezne države Maryland, da uporabi njegov DNK profil za identifikacijo. O zadevi je dokončno odločilo Vrhovno sodišče ZDA, ki je s tesno večino petih vrhovnih sodnikov zavzelo stališče, da sta - kadar policija na podlagi utemeljenega suma storitve hudega kaznivega dejanja pridrži posameznika in ga privede na policijsko postajo - odvzem in analiza sline zaradi pridobitve osumljenčevega DNK, podobno kot odvzem prstnih odtisov in fotografiranje legitimna policijska postopka, ki sta razumna z vidika IV. amandmaja k ustavi ZDA, baze DNK profilov pa služijo legitimnemu interesu države, da na varen in točen način procesira in identificira [pridržane] osebe.

Celotna odločitev Vrhovnega sodišča ZDA skupaj z ločenimi mnenji je dostopna TUKAJ, na tem LINKU pa se nahaja članek Davida H. Kaya z izčrpno analizo sodbe.

sobota, 23. maj 2015

Trdovratni podatki

Raziskovalci iz Univerze v Cambridgeu so v raziskavi učinkovitosti funkcije resetiranja pametnega telefona z nameščenim Android sistemom (verzije 2.3x do 4.3) nazaj na tovarniške nastavitve (gre za funkcijo, s katero naj bi se – po splošnem prepričanju – izbrisali prav vsi podatki in nastavitve v napravi) ugotovili, da več kot 630 milijonov telefonov podatkov dejansko ne izbriše in jih je mogoče ponovno priklicati. Konkretneje je ocenjeno, da 500 mio telefonov ne izbriše particij z občutljivimi podatki (npr. gesli za dostop do Gmail-a), več kot 630 mio telefonov pa ne izbriše niti podatkov iz SD kartic, kjer so pogosto shranjene fotografije in videoposnetki. Do podatkov se je v precejšnjem številu primerov mogoče dokopati tudi, če je bil telefon zaščiten s šifriranjem (full-disk encryption), saj se pri ponovni vzpostavitvi tovarniških nastavitev ključ za dešifriranje ne izbriše.

Ko prodamo, zavržemo ali drugače upokojimo svoj pametni Android telefon, resetiranje na tovarniške nastavitve torej ne pomeni nujno, da smo s tem uničili podatke v njem. In kaj (če sploh kaj) lahko storimo, da kupcu ali najditelju našega pametnega telefona onemogočimo dostop do podatkov in potencialno zlorabo? Več o tem preberite TUKAJ (link).

ponedeljek, 18. maj 2015

Barbie in Samsung TV, ki posluša

Lep prikaz "interneta stvari", ki proizvaja velike količine podatkov, zapis by Bruce Schneier v Guardian:

I realised that I had been thinking about the refrigerator backwards: it’s not a refrigerator with a computer, it’s a computer that keeps food cold. Just like that, everything is turning into a computer. Your phone is a computer that makes calls. Your car is a computer with wheels and an engine. Your oven is a computer that cooks lasagne. Your camera is a computer that takes pictures. Even our pets and livestock are now regularly chipped; my cat could be considered a computer that sleeps in the sun all day.

Surveillance is the business model of the internet for two primary reasons: people like free and people like convenient. The truth is, though, that people aren’t given much of a choice. It’s either surveillance or nothing and the surveillance is conveniently invisible so you don’t have to think about it. And it’s all possible because laws have failed to keep up with changes in business practices.

četrtek, 14. maj 2015

Žižku je vseeno, če ga nadzorujejo

torek, 12. maj 2015

Pacient vas bo sedaj sprejel - kako bo mobilna tehnologija spremenila medicino

V novi prodajni uspešnici z naslovom The Patient Will See You Now: The Future of Medicine is in Your Hands, ameriški kardiolog Eric Topol podrobno analizira, kako bo demokratizacija medicinske diagnostike vplivala zdravstveni sistem. Proces spreminjanja medicine primerja z Gutenbergove iznajdbo tiska in demokratizacijo znanja, ki je shranjeno v knjigah. Že zelo kmalu bomo lahko veliko diagnostičnih testov opravili kar preko dodatkov za svoje telefone. Ti podatki nam bodo skupaj s pametnimi algoritmi v telefonih v veliko pomoč pri odločanju, kdaj dejansko je treba k pravemu zdravniki in kdaj je bolje ostati doma. Topol je kot kardiolog že prejel e-pismo s posnetkom srčnega ritma, ki mu ga je poslal pacient in ga spraševal, če ima srčni napad. Od demokratizacije medicinske diagnostike in medicinskih podatkov, kot opredeli revolucijo, bomo imeli po njegovem mnenju vsi velike koristi. Tule je posnetek predstavitve knjige v televizijski pogovorni oddaji:

četrtek, 23. april 2015

cfp. Workshop on Fairness, Accountability, and Transparency in Machine Learning

Na delavnici ICML 2015, 11. julija, Lille, Francija, o strojnem učenju ("machine learinig") bodo obravnavali ključno tematiko velikega podatkovja in algoritmičnih predikcij:

kako preprečiti vkodiranje predsodkov v avtomatizirane odločitve?

Pravni odločevalci se bodo s sistemi za pomoč pri odločanju, ki temeljijo na algoritmih, (lahko) hitro skrili za algoritem, češ “the algorithm made me do it”. Vprašanje odgovornosti za odločitve je eno izmed ključnih pri uporabi velikega podatkovja za odločitve.

Submission Deadline: May 1, 2015.

TOPICS OF INTEREST
-------------------------------

We welcome contributions on theoretical models, empirical work, and everything in between, including (but not limited to) contributions that address the following open questions:

* How can we achieve high classification accuracy while preventing discriminatory biases?

* What are meaningful formal fairness properties?

* What is the best way to represent how a classifier or model has generated a particular result?

* Can we certify that some output has an explanatory representation?

* How do we balance the need for knowledge of sensitive attributes for fair modeling and classification with concerns and limitations around the collection and use of sensitive attributes?

* What ethical obligations does the machine learning community have when models affect the lives of real people?

PAPER SUBMISSION
-----------------------------

Papers are limited to four content pages, including figures and tables, and must follow the ICML 2015 format; however, an additional fifth page containing only cited references is permitted. Papers SHOULD be anonymized. Accepted papers will be made available on the workshop website; however, the workshop's proceedings can be considered non-archival, meaning contributors are free to publish their work in archival journals or conferences. Accepted papers will be either presented as a talk or poster (to be determined by the workshop organizers).

Papers should be submitted here: https://easychair.org/conferences/?conf=fatml2015

Deadline for submissions: May 1, 2015
Notification of acceptance: May 10, 2015

ORGANIZATION
----------------------

Workshop Organizers:

Solon Barocas, Princeton University
Sorelle Friedler, Haverford College
Moritz Hardt, IBM Almaden Research Center
Joshua Kroll, Princeton University
Carlos Scheidegger, University of Arizona
Suresh Venkatasubramanian, University of Utah
Hanna Wallach, Microsoft Research NYC

petek, 17. april 2015

Računalnik NAMESTO sodnika?

Na rtvslo.si so objavili intervju z dr. Juretom Leskovcem, enem izmed najuspešnejših slovenskih znanstvenikov, ki delujejo v tujini. Naslov prispevka "Računalnik je lahko boljši od sodnika" je zavajajoč in ne povzema povsem tega, kar je Leskovec v resnici povedal.

Kaj ste ugotovili iz analize dveh milijonov sodniških primerov? Za kakšne primere je šlo?

Sodelovali smo z ekonomisti Harvarda, Cornella in Univerze v Chicagu. Dobili smo dostop do dveh milijonov primerov iz predkazenskih postopkov. Nekdo se, recimo, stepe v baru. Primejo ga, pripeljejo pred sodnika, ta pa se mora odločiti, ali je prestopnik nevaren ali ne. Lahko ga pod varščino spusti, lahko pa ga vtakne v pripor, da tam počaka na vsebinsko sodno obravnavo. Če je nekdo v priporu, je to seveda slabo zanj in obenem slabo za družbo. Če pa ga sodnik spusti, se lahko zgodi, da ta oseba zapusti državo ali ponovi kaznivo dejanje. Tu nastopi vprašanje, ali bi lahko sodnikom kakor koli pomagali k boljšemu odločanju.
Analiza nam je prinesla dve zanimivi ugotovitvi. Prva: objektiven program deluje 60 odstotkov bolje kot sodniki v ZDA. Razlika nastane v tem, da lahko program v nasprotju s človeškim sodnikom natančno analizira dva milijona sodnih primerov in najde vzorce v lastnostih prestopnikov, ki so povezani z negativnim obnašanjem v prihodnosti. Druga: analize kažejo, da se človek preveč osredini na osebne karakteristike. Program ima namreč dostop samo do kartoteke osumljenca. Sodnik osebo še vidi in pri presoji uporablja neka dodatna merila, ki ga vodijo v neoptimalne odločitve. To še delamo, a vsi, ki so videli dozdajšnje rezultate, so bili kar navdušeni in jih je zadeva zelo zanimala. Kmalu bomo delo objavili. Treba pa je poudariti, da ideja ni, da bi računalniki zamenjali ljudi, ampak kako lahko računalniki in ljudje skupaj sprejemajo boljše odločitve.


vir: http://cs.stanford.edu

Številne anomalije v ameriškem sistemu kaznovanja seveda kličejo po inovacijah. V sistemu, ki ga preveva rasna diskriminacija in ki (tudi) zaradi svoje togosti ustvarja primere, daleč od sodobnega pojmovanja pravičnosti, je iskanje novih rešitev najbrž nekaj temeljnega. Zadeva je šla tako daleč, da je pred časom ameriški profesor Bernard Harcourt hudomušno, a ne neresno, predlagal, da bi boljše odločitve lahko sprejemali z metom kovanca.

Leskovec pravi, da na podlagi analize dveh milijonov primerov iz ameriške sodne prakse razvijajo tehnologijo, ki bo v pomoč sodnikom pri odločanju. Odlično! Ampak:

Nekdo ima kartoteko, drugi je nima. Podatki so od človeka do človeka različno dostopni. Kje so omejitve uporabnosti te metode - le na ljudeh s kriminalno preteklostjo?
Ne nujno. Veliko stvari se lahko vprašaš. Koliko časa nekdo živi na istem naslovu? Ima nepremičnino v lasti ali plačuje najemnino? Ima mobilni telefon? Veliko je demografskih podatkov. Sicer med njimi ne sme biti vere, barve kože in spola. Socialno-demografska kartoteka je zelo velika in kriminalna kartoteka sploh ni nujna. Čeprav je v realnosti velik del teh ljudi povratnikov.

Ta zbirka demografskih podatkov je ključ do težave ali rešitve problema. Katere podatke bomo zajeli? Kot pravi Leskovec, med njimi ne sme biti vere, barve kože in spola. Ne sme biti torej podatkov, ki bi vodili v diskriminacijo. Problem je v tem, da vsi podatki, ki o nekem posamezniku obstajajo, izvirajo iz njegovih značilnosti, ki so povezane z njegovo bitjo. Povsem utemeljena je za ameriške razmere ocena, da črnski del populacije prebiva na določenih območjih, na drugih ne. Da ima manjši delež v lasti nepremičnino, da je slabše ekonomsko situiran, da je več enostarševskih družin. Kar so vse dejavniki, ki jih program načeloma lahko upošteva, saj sami po sebi niso diskiminatorni. Diskriminatorni postanejo šele, ko med njimi najdemo skupno točko, ki temelji na rasi.

Prepričana sem, da bodo raziskovalci v Leskovčevi skupini vse omenjeno skušali kar se da upoštevati. Pomemben je tudi njegov poudarek, da gre za razvoj orodja, ki bi bil lahko v pomoč sodnikom. Tudi to je lahko sicer problematično, še posebej, kadar v igro vpelje tvegan koncept prognoze, nekoliko manj pa, ko temelji na obstoječih bazah podatkov o dosojenih primerih.

A bolj zaskrbljujoč je novinarjev naslov, ki mu dosledno sledijo tudi komentarji (seveda anonimnih) bralcev, ki si (tudi) v Sloveniji namesto sodnikov želijo več računalnikov. Kar ostaja nezapisano ali premalo poudarjeno, je dejstvo, da za vsakim računalnikom stoji človek ali skupina ljudi, ki zapiše kodo, algoritem, po katerem bo računalnik izvajal analizo. Odgovornost za odločitev s tem samo prestavimo, zabrišemo, možnosti za zlorabo pa ostajajo (le da je nevarnost tovrstne zlorabe kar sistemska in ne vezana na posamezne primere).