開放人民的力量
食夢黑貘
OPENDATA
所謂透明/開放、透通/連結,是說什麼樣的東西可以連結在一起開放,如何把政府的資料開放給大家用,並不是政府開放給人民,讓人民去使用,事實上應該是這四個面向要互相能夠open:opengovernment、openbusiness、opencollege、opencivic,這是個4*4的連結點,而並不是單一連結點。
雖然目前大家比較注意在政府和人民之間的連結點,那重要的就是如何讓人民的聲音傳遞到政府?如何讓學術研究知道真正的社會?如何創造出真正有價值的產品與服務?如何討論出真正的想法這都是有趣的議題。
現實的問題
做出一個系統,讓大家知道朋友之間的同儕意見
1.政府在自創民意這件事,我們能不能夠去監測得到?
2.有無可能去突破到網路的集體迷思?
3.媒體對這些東西有沒有可能去證明?
4.或者是一個數量,例如哪個媒體最腥羶色、哪個媒體最喜歡用「網友說」?這些東西事實上而言,你說要透過結構化的去抓取或是去判斷,並不是不可能的。
5.怎麼樣讓人跟人之間的關係更緊密?
集體迷思
很多人以為看到的是資訊的全貌,事實上並不然,大家都以為這次的318學運是靠著資訊的力量去能夠很輕易的帶動一些人,而去改變什麼,但其實這些工具在更早以前的樂生事件就已經有了。
這裡有兩個問題點,第一:「資訊傳遞本身有限」,事實上很多人都認為,「網路」是資訊上非常流通的地方,理論上不可能會有什麼資訊屏障,但是人會建立自己的屏障,無論是他在選擇媒體、或是他自己想聽的、或者是聽了之後他真的聽得進去的,在這種情況下,人自然而然的建立了一個屏障,並且以為他得到的是所有的資訊,問題是他只相信自己想相信的東西;當然還有一個問題是第二點:「人會在不自覺的情況下過濾資訊」,像是2007年的樂生效應,那時候有在玩網路的人都知道,那時候全部被樂生洗板嘛,你無論到部落格或是噗浪,那時還沒有臉書,到處都是樂生的事情,可是你打開新聞,什麼屁都沒有,沒有人提到樂生,你會覺得進入到兩個不一樣的社會,所以我們那時就開始考慮說,怎麼樣能解決這個問題。
失敗的MOOT
當時我們就做了一個很有趣的計畫,叫做MOOT(Media Observation of Taiwan),就是想要觀察媒體,因為當時2007年WEB2.0很紅嘛,我們就建立了一個WEB2.O計畫,其中有一個計畫就是「部落格好好讀」,這個計畫就是:我們大概抓了四十多萬的部落格,找出他們共同的議題跟語言,但是我們知道部落格在做什麼,卻不知道媒體在做什麼,因為那時沒有媒體網路,無論是新聞或是雜誌都沒有人上網,而我們的計畫就失敗了。
當時是想說有沒有可能找一堆人把所有的新聞雜誌都key上去,結果這是不可能的事情,雖然我們真的很想做,所以這個計畫就一直擺在那邊,最後就失敗了。
林克傳說(第一期)
一直到最後,我們發展出林克傳說,透過臉書讓大家知道大家在想什麼,透過這個方法讓大家知道如何突破集體迷思是我們的目標,所以你必須知道你訊息的屏障,在這之前,你還必須知道你自己訊息的屬性。當然我們知道你的訊息,在臉書而言就是你的社群,其實就是「近朱者赤,近墨者黑」的道理,你會選擇你的臉書好友、你的臉書訊息來源,舉個例子,我有個朋友是綠骨藍皮的,那我就有建議我幾個朋友去follow他,結果說的當天就有20幾人
follow,但過了幾天之後follow人數就只剩兩個人了。這個故事告訴我們,人會很本能的去選擇自己想要看的,但我們現在想做的,不是說想讓大家都成為同質性的人,是想要讓大家了解自己是屬於什麼屬性的人。
林克傳說(第二期)
後來在今年三月十號的時候我們做出了另外一個東西,能夠去分析現在的熱門議題跟話題,那之後就派上用場了,你可以知道哪些熱門網站的話題跟趨勢,大家到底有沒有在關心核電?或是核電的議題的狀況?但是過了五天,318就發生了。
當然接下來我們會嘗試做一些新系統,出櫃系統,那這個出櫃不是那個出櫃啦,就是看你自己的屬性,大家有空可以去試試看,看你是會投給連勝文、柯文哲、還是馮光遠。這個理論上是超神準的,這也是很有趣的地方。人,很難去表達自己的意見,人不太喜歡come out,可是我只要觀察你的朋友,就能觀察你無意間過濾的資訊,進而知道出你會投給誰,也就是說透過這個系統,我們可以觀察出很多東西,其中也包含出你的屬性、或是你手機想買哪種的,我們利用林克傳說去做出很多實驗,包含媒體的分佈,這些東西都可以這樣做到。
那為什麼可以這樣做到呢?很重要的就是量級,林克傳說目前是蒐集一百萬個使用者的塗鴉牆,但比台灣兩千三百萬人還是少數,但做台灣的統計調查三千多個就夠了,也有人一百、兩百個就敢公佈了不是嗎?所以一百萬個使用者的準確度是非常可怕的,但是會面臨到一個很嚴重的問題,就是取樣的全部都是網路上的人。
當然說難聽一點,過了十幾年,那些沒用網路的人都死了,我們要解決的是數位落差嘛,過了幾年大家都上網了,就沒有那些問題了。
資料的探勘
在場很多心理跟社會的嘛,那我稍微介紹一下次級資料。我們利用二手資料,能夠去取得很有趣的東西。我舉個最有趣的例子,微軟每年都會公佈使用ie6使用的比例嘛,我們就發現很有趣的現象,使用ie6的比例也可以代表每個國家資訊化的程度,越早資訊化的國家他使用ie6的程度最高,但是像是瑞典從70%降到20%的ie6使用程度,台灣也從70%降到了60%,這代表了什麼?也就是說,我們可以從這個統計資料得出兩種資訊,第一點是:資訊化的程度、第二個是:資訊化的進步,資訊使用改變的狀況。意思就是說它使用之後覺得不好用,或是有更新的瀏覽器上市,所以使用者就汰舊換新了。也就是說,我們很多東西不一定只能從表面去得到,從綜合指標去反推其它的屬性及因子,用所謂的次級資料來去運算。
好我們就直接進結論,我們的政府離開放政府還有一段距離,318也沒有追求所謂的透明化民意,但是我是相信,要是人民能夠出櫃come out出來說我是什麼樣的想法,甚至能夠去互動,但這個出櫃的想法不一定屬於政治上的,也可以屬於消費上的,或是生活興趣上的,自己能跟社會互動,我相信這樣生活會更好。
當然身為一個技術人員,我們可不可能去做一些事情,讓大家知道你的朋友喜歡聽什麼音樂、做什麼事情、喜歡吃什麼東西,這也是我們系統想要達到的目標,好,謝謝大家。
http://www.tw-sts.org/sites/default/files/03%20%E9%96%8B%E6%94%BE%E4%BA%BA%E6%B0%91%E7%9A%84%E5%8A%9B%E9%87%8F.pdf#overlay-context=home
http://www.tw-sts.org/sites/default/files/03%20%E9%96%8B%E6%94%BE%E4%BA%BA%E6%B0%91%E7%9A%84%E5%8A%9B%E9%87%8F.pdf#overlay-context=home