北京時(shí)間1月10日消息,據(jù)國外媒體報(bào)道,15歲,通常是一名少年剛剛進(jìn)入人生高中階段的時(shí)候,當(dāng)同齡人紛紛選擇在這個(gè)年齡段盡情玩樂的時(shí)候,名為泰楠·唐鐸普特(Tanay Tandonput)高中生卻開發(fā)了一款名為“Clipped”的精品閱讀應(yīng)用,并對其所使用的基于自然語言處理的智能算法申請了專利。
日前,唐鐸普特抽空接受了美國知名商業(yè)雜志《Fast Company》撰稿人大衛(wèi)·扎克斯(David Zax)的專訪。在采訪中,唐鐸普特透露,最初開發(fā)Clipped只是為了幫助自己在學(xué)校更好的參與辯論賽,這一工作并沒有影響到自己作為普通高中生的生活。除此之外,他還認(rèn)為“發(fā)布產(chǎn)品沒有年輕與否之說,更沒有年齡限制。”
以下是文章主要內(nèi)容:
我們曾邀請?zhí)畦I普特到現(xiàn)場來參與我們的訪問,但由于沒有取得學(xué)車執(zhí)照(learner’s permit是美國考駕照的前一步,與國內(nèi)交規(guī)考試的差別就是拿到學(xué)車執(zhí)照的人就可以上路了,不過必須要有駕照的人坐在旁邊),因此唐鐸普特最終沒能成行。對于唐鐸普特的難處,我們感到十分理解。因?yàn)樘畦I普特不僅需要頻繁參加學(xué)校舉辦的各種辯論賽、上課、與朋友出行游玩,而且他大部分的業(yè)余時(shí)間都被花在了自己于年前推出的一款精品閱讀應(yīng)用“Clipped”的開發(fā)工作中。
當(dāng)下新聞閱讀類的應(yīng)用不勝枚舉,部分應(yīng)用的用戶體驗(yàn)十分出色,其中就包括大名鼎鼎的新聞聚合社交應(yīng)用Flipboard。除了Flipboard以外,還有無數(shù)的初創(chuàng)公司投身于這個(gè)領(lǐng)域,比如Zite、Cir.ca和Summly。不過,由唐鐸普特開發(fā)的Clipped應(yīng)用的主打功能卻很有意思,那就是自動(dòng)幫助用戶過濾無用內(nèi)容,然后根據(jù)關(guān)鍵信息給出一個(gè)簡練的內(nèi)容摘要。用戶只需要提交一個(gè)文章地址,Clipped就會利用基于自然語言處理的智能算法過濾掉沒有太多意義或者不重要的細(xì)節(jié)內(nèi)容,通過統(tǒng)計(jì)和關(guān)鍵字的組合分析,Clipped能夠?qū)π畔K的重要度進(jìn)行排名,并選出那些關(guān)聯(lián)系數(shù)最高的句子。然后,Clipped根據(jù)分析結(jié)果生成內(nèi)容摘要,最后還會重新讀取自動(dòng)生成的摘要進(jìn)行分析,以確保選定的信息內(nèi)容是合理的。然后,該應(yīng)用才會將最終結(jié)果呈現(xiàn)給用戶閱讀。一般來說,一篇文章經(jīng)過Clipped過濾之后只會剩下三句話左右。
Clipped對“精簡”的理念貫徹的十分徹底,他們甚至在Clipped應(yīng)用內(nèi)部內(nèi)置了一個(gè)新聞?wù)獧z索功能。這也就是說,即使被Clipped精簡過的文章內(nèi)容已經(jīng)很少了,開發(fā)商還是認(rèn)為其中包含了部分用戶不感興趣的內(nèi)容,所以Clipped允許用戶根據(jù)自己的興趣輸入關(guān)鍵詞進(jìn)行檢索,也就是讓用戶對已經(jīng)精簡過的內(nèi)容再進(jìn)行一次主動(dòng)篩眩目前,Clipped已推出Android版和iOS版應(yīng)用,同時(shí)推出了桌面版的瀏覽器插件,可支持Safari、Firefox、Chrome和IE瀏覽器。此外,Clipped還為開發(fā)者提供了API,開發(fā)者可將Clipped的功能內(nèi)置到自己的應(yīng)用中。
唐鐸普特坦言,自己對自然語言處理技術(shù)非常癡迷,自己最初開發(fā)Clipped就是為了讓自己在學(xué)校的辯論賽中可以以更快的速度閱讀到有用信息。所以,當(dāng)他最初設(shè)計(jì)Clipped時(shí),就考慮到了要讓用戶一開啟應(yīng)用就可以立刻看到最重要信息這一方面。不過,唐鐸普特也坦言,目前的Clipped還遠(yuǎn)遠(yuǎn)稱不上完美,仍然有著許多需要提高的地方。
日前,我們有幸采訪到了唐鐸普特,以下是本次專訪主要內(nèi)容:
扎克斯:你是怎么想到開發(fā)Clipped這個(gè)點(diǎn)子的?
唐鐸普特:我是一名十分熱衷于“林肯—道格拉斯”式辯論(The Lincoln-Douglas Debates)的辯手,因此在每次辯論前我都需要進(jìn)行許多準(zhǔn)備工作,這一過程十分冗繁。因此我產(chǎn)生了讓一篇文章濃縮成短小精悍短文的想法。去年,我編寫出了基于自然語言處理智能算法的第一個(gè)版本,然后花了去年一整年的時(shí)間對此進(jìn)行修改。最后,我認(rèn)為這一算法不僅適用于辯論領(lǐng)域,而且還適用于新聞文章及其他文獻(xiàn)的閱讀領(lǐng)域。
扎克斯:部分用戶反映Clipped的文章精簡功能有時(shí)并不好用。
唐鐸普特:新版Clipped中的自然語言處理智能算法主要針對長度在一頁至兩頁之間的文章,目標(biāo)文章風(fēng)格主要是敘述性或信息類,而不是主要針對闡述觀點(diǎn)類的文章。不過,目前我正在針對闡述觀點(diǎn)類的文章對這一算法進(jìn)行優(yōu)化。
在一個(gè)普通的上課日中,我在回家后通常會先做3、4個(gè)小時(shí)的家庭作業(yè),然后同朋友出去玩1、2個(gè)小時(shí),最后才回家利用一天中剩余的時(shí)間處理Clipped方面的工作。
扎克斯:當(dāng)你在為自己的辯論賽而開發(fā)這一自然語言處理智能算法的時(shí)候,你自己是怎么使用這一工具的?
唐鐸普特:以前,我通常會快速閱覽許多文章,如果我喜歡其中某一篇文章的話會從頭開始閱讀。比如,在一場普通的辯論賽中,我手頭大約會有100份長度在二到三頁的文章資料。其中,有部分文章的標(biāo)題或許十分有吸引力,但在經(jīng)過Clipped精簡后我們通常會發(fā)現(xiàn)文章的中心根本不是我們所需要的內(nèi)容。去年,我曾參加過一場有關(guān)“保障動(dòng)物權(quán)利”的辯論,期間我找到一份有關(guān)這一話題的文章,但這篇文章的重點(diǎn)是討論“保障動(dòng)物權(quán)利”哲學(xué)方面的意義,但我所需要的是“保障動(dòng)物權(quán)利”在科學(xué)方面的根據(jù),比如“有研究發(fā)現(xiàn)動(dòng)物可以和人類一樣進(jìn)行思考”這樣的內(nèi)容。
扎克斯:最近我曾接觸過一個(gè)19歲和20歲的年輕創(chuàng)業(yè)家,但你是我所見過最年輕的創(chuàng)業(yè)者。這個(gè)月你就將年滿16歲,你有去申請“學(xué)車駕照”的打算嗎?
唐鐸普特:還沒有,或許我會在這個(gè)夏天考慮這方面的事情。
扎克斯:你是不是應(yīng)該更多的參與高中生的日常活動(dòng),比如約會、參加舞會什么的?在高中的時(shí)候就將精力投入到Clipped是不是很難?
唐鐸普特:從某種意義上來看,Clipped對我來說十分特別,因?yàn)樗俏蚁M趯W(xué)校實(shí)現(xiàn)的目標(biāo)。不過,我并不認(rèn)為人們應(yīng)該紛紛效仿我的做法,我對于教育的重要性深信不疑,而我也肯定會進(jìn)入大學(xué)。在開始這一工作的時(shí)候,我并沒有抱著要開發(fā)一款產(chǎn)品的想法,只是希望能夠改善、優(yōu)化我們辯論團(tuán)隊(duì)的準(zhǔn)備流程而已。除此之外,我的生活重心仍然是一名普通的高中生,我經(jīng)常與朋友出去玩、打網(wǎng)球,并參與其他運(yùn)動(dòng)。
扎克斯:去年你花了多少時(shí)間在Clipped上?
唐鐸普特:就像我此前所說的,在一個(gè)普通的上課日中,我在回家后通常會先做3、4個(gè)小時(shí)的家庭作業(yè),然后同朋友出去玩1、2個(gè)小時(shí),最后才回家利用一天中剩余的時(shí)間處理Clipped的工作。不過,Clipped正式發(fā)布前的幾周正好是寒假,因此我不需要去上學(xué),所以每天大約可以工作6、7個(gè)小時(shí)。
扎克斯:你認(rèn)為,對于產(chǎn)品發(fā)布來說,年齡是否會成為一種限制?
唐鐸普特:我認(rèn)為發(fā)布產(chǎn)品沒有年輕與否之說,只要確保你身邊有合適的同伴、并心無雜念,你就可以在任何年齡發(fā)布產(chǎn)品。在開發(fā)Clipped的過程中,我根本沒有在意自己的年齡,也就這么成了。