楊晶晶現在可以全天在床上完成工作。講述者供圖
現實時間仿佛靜止了:出門的需求和說話一樣,變得越來越少,某一天,楊晶晶忽然發現自己的口紅已經過期了,許久沒有使用,都被遺忘在角落,衣服網購了幾件新的,試穿后被再度掛起來,吊牌都沒摘。
一次,她看到群里跳出一條消息:完了,我今天下樓看到快遞小哥都想拉他聊兩句,太久沒社交了。楊晶晶覺得好笑又真實,這是個“數字游民”交流群,成員在全國各地旅居、居家辦公,工作時間自由,以及“都很孤獨”。
但在兩年前,楊晶晶無法想象這種“零交流生活”。她是個閑不住的人,做過電梯公司文員,4S店信息員,給百度公司做了一周外包,又在消防器材公司待了三天,最后留在了教培行業,“當時去補課班,學生們都挺喜歡我的。”她第一次獲得了成就感。
教培機構里,楊晶晶愛笑,聲音飽含情緒,認同別人的時候會認真地說“是的”,一年大部分時間,楊晶晶都在說話。盡管她只有民辦大專畢業證,在這個行業干了七八年,她是成功者,最終當上青海一家教培機構的校長。
還有一個特殊的、沒有明確頭銜的身份,楊晶晶是學校里最難搞的學生、家長的“負責人”。同事應對不了的問題學生,都歸到她手底下,甚至可以湊出一個小班。有不少家長特意找到她,付大幾千元課時費,目的不是補課,“能不能跟我孩子聊一聊?開導一下他。”
直到2021年7月,“雙減”政策之后,楊晶晶和所有員工談完,她是“被自己裁掉的最后一個”。
所有的“認可”也隨之消失了,她掉進了另一種生活。
被“標注”的現實
大多時候,數據標注員的生活是單調的,一個項目超過6小時沒人接手,就會被傳到其他人的數據庫中,這由AI提供的云計算服務協助完成,為AI提供數據的工作,同樣由AI進行監督,楊晶晶被監督著,這極度“減少了摸魚的可能性”。
這也是她曾經最反感的工作狀態。她去深圳出差時,住的地方離騰訊不遠,每天凌晨1點,整棟樓通明,看起來還是滿的,她感覺里面每個人都是高負荷狀態,薪資也沒高到夸張,和自己做教培差不多。那時她沒想到,兩年之后,和人工智能打交道的數據標注員,成為了自己最后的出路。
每天,楊晶晶至少標注5小時,期間整個身心投入工作,有時需要熬夜。她標注的是地圖方面,不同屬性的物品對應不同的顏色,樹木是深綠色,草地是淺綠色,籃球場是藍色,房屋是紅色。這份工作反過來影響她,每次走在路上,看到小區附近的學校,楊晶晶控制不住地在心里想:教學樓屬于房屋,房屋是紅色的。
而面前的路,如果寬度長于5米,應該是一條道路,如果小于5米呢?可能是一條私家車道,如果在別墅區或商業區,那又是不同的標注。這是她最近最厭煩的項目。
不是每一次都能心情平靜,像數念珠一樣做完,她不是一個有耐心的人,每個項目相似,差別細微,打開圖片密密麻麻,全是數據和線條,楊晶晶開始煩躁:“又要改線,又要改路寬,真的很煎熬,完全做不下去。”錯誤率變高時,效率也在下降,一張圖可能要做上一個小時,甚至更久。
深度學習的人工智能
這是數據標注員工作和生活的常態,在各個視頻平臺搜索,你都能輕易看到,他們可能在車間,可能在家里,相似的是電腦屏幕,微微皺起的眉頭,以及長久的沉默。
五年前,在河南鄭州某個小縣城,20歲出頭的李騰就開始習慣這種沉默。他們在類似電商園里的工作室,不大的房間里有二十幾臺電腦,李騰是第三個員工,此后趕上暑假,有剛高考完的畢業生、放假的大學生,最多有十六七個人。假期結束,只剩下五六個。
李騰干的項目據說和百度對接,每人發一份視頻和文字教程,看好后做練習題,正確率達到標準,就可以開始干活。他覺得沒什么難度,“也是底層工作,就跟搬磚差不多。”
工作室老板和李騰年紀相仿,很早輟學,知道的渠道多,經常干冷門活計,老板介紹,這是大數據,無人駕駛系統的基礎架構,李騰覺得“怪高大上的”。
他的工作和楊晶晶類似,但那時工作內容比現在簡單得多,主要是2D平面圖像,導航車拍攝路上的照片,數據標注員負責標注:這個障礙物是欄桿,是紅綠燈,是人,是狗,一組照片標完,錢就到手,計件結算。
逐漸熟練后,最多時,李騰一天能拉6000個框,工作將近12小時,但現在,單個框價格已經從1毛2分降到了6分甚至以下,還有些工作在項目單上消失了,李騰猜測“可能是被有背景的工作室截下了”,事實上,由于AI的自動識別能力也在進步,這些工作已經不需要人來做了。
兩年下來,李騰的頭發掉了一堆,他仗著年輕,把這份工作當成全職,一天最少標注8小時,到了飯點也舍不得放下電腦,只能家人送飯過來,然后抓緊扒幾口,繼續拉框。
高強度工作帶來的,是比楊晶晶更嚴重的“癥狀”。那兩年,走在路上,看到行人,身體朝向多少度、是站是蹲、身側是一根柱子還是一片圍欄,李騰都會在心里拉框。他還曾為美顏軟件做過標注,眼睛、睫毛、嘴唇,每樣都有對應顏色,為了提高效率,李騰反復背下這些信息。有一天,他和家人對視,發現自己在心里無意識地對熟悉的五官開始框選、填色。
他也在那時養成了聽恐怖小說的習慣,為了緩解標注的枯燥和重復感,李騰一般會聽語音電臺、有聲小說作為背景音,其中恐怖小說效果最好,汗毛豎起的時候,睡意也消失大半。哪怕現在已經從事其他行業,他的電臺會員仍在續費。
老師
剛入行時,屏幕那邊的培訓老師比自己年輕,這時常讓楊晶晶有些尷尬,尤其是當標注內容出錯時——自己做老師時,她經驗豐富,被所有人喜歡,現在卻又變回了學生和“小白”,只能重新學習。
和楊晶晶同批入行的人,有不少都辭職了,還有的一直停留在最初水平,只能做最簡單基礎的工作,比如標注一些方言、語料,工資極低,楊晶晶已經開始上手中上難度的工作了,涉及到一些畫圖技能。
她把這歸結于自己的學習能力,有時老師直播講解的內容不甚清晰,楊晶晶判斷“他自己會做,但不太擅長講給別人”。她覺得自己的溝通和表達能力更好,可以給其他人轉述更清楚,可惜大部分時候,她和同事們沒什么交流機會,只有項目出錯時,才會簡單對話幾句。
一切和做教培時太不一樣了。那時,楊晶晶比大部分教培同行學歷低,但學生們都喜歡她,最初教課時,她每次都要課前突擊復習,或者干脆說“這道題老師也沒有弄明白,我們一起研究好嗎?”,學生們從來沒遇到過這樣說的老師;后來她被調到管理層,找她的學生更多了,求她幫忙開導心結、規劃未來,下屬們也佩服她“擅長和學生打交道”,這都讓楊晶晶覺得自己“在機構里是不可替代的”。
她有著不少觀察,學生們缺乏生活技能,因為高考而焦慮,對未來含糊不清,楊晶晶能和他們打成一片,是看到學生人格的那個人。外地參觀學習時,她偶遇一個輕生的高三學生,在場的老師都不敢說話,她上去抱住學生大腿,阻止他跳樓,安撫談話,后來離開時,那個學生給她鞠了一個90度的躬。
那是她職業的高光時刻,“大部分老師都只會教書,不會育人。”她覺得自己會育人。哪怕現在,每年高考季,還是有新的學生和家長被她的老客戶推薦,請她幫忙做志愿規劃。
楊晶晶做教培時的工位。講述者供圖
但現在,這些都派不上用場。數據標注不需要任何共情和感知。每一個數據標注員都面目模糊,楊晶晶和同事們都不知道彼此的長相、性格和現實生活,可能某天換了人也不知道。
有些時候,楊晶晶感到難以忍受,同事像網友,而所謂的“學生”——被標注的數據沒有情緒,不會給“老師”任何正向反饋,AI更不會,她甚至不了解數據具體供應給哪些AI,國內的還是國外的——這都有保密協議,數據標注員很難知道產品如何落地。
唯一會變化的,只有隨著標注數量而跳動的工資,連標準也不具體,楊晶晶大概知道,它和標注的平方米有關,有點像粉刷工。這談不上任何價值感,更別提教育,宣傳語里“AI的老師”,成為了一個輕易就能被戳破的騙局。
但她依然沒放棄。她盤算著,等學得再深入一點,掌握了技術內容,就可以給數據標注員講課,對著屏幕后的真人,自己肯定更親切、內容更加容易理解,畢竟“我教別人學東西比他們更好,因為有時候做技術的,教課不是特別全面。”
藥渣
不過,這個計劃的前提是,數據標注員依然被行業需要。有一次,一個之前認識的行業“大佬”講起,“未來哪怕是你家門前的一棵樹,一片葉子,都會被標注。”語氣興奮而夸張。楊晶晶有種說不出來的感覺,這似乎是必然的未來,她心里也有期待,但“所有行業都被替代了之后,人怎么辦呢?”
楊晶晶不止一次感受到,“它太聰明了,教會它,它就替代我的工作。”她剛入行時做過的比較基礎的標注項目已經取消了,現在,“AI已經能自己識別了,它不需要(人)了。”
已經轉行,但偶爾還會做數據標注中介的趙一珥說,數據標注員起初是藥材,看起來平平無奇,熬制成中藥卻能發揮作用,可當一切都被“熬”給了人工智能之后,智慧、精力都被榨干,就成為了人工智能的藥渣。
“如果你告訴他,熬的過程很痛苦,你覺得他會來嗎?”趙一珥每次宣傳招聘一般會說,這是前沿行業,和人工智能、自動駕駛相關,底薪3000塊,多勞多得。事實上,大部分員工都只能拿到底薪,每天要求的標注量太大,很少有人能超額完成。大部分員工會在三個月到半年左右流失,“那就招下一批。”
這是個吸收人體智力的行業,但人從中學習到的技能有限。不過,趙一珥會描繪成:這份工作讓見證了目前科技發展的最前沿,是很多科技公司最急需的內容,通過你的標注就能知道行業發展方向,以及未來趨勢——你可以把握未來。
但如果聽實話,趙一珥的聲音抬高,帶著諷刺:“沒啥作用,你說你天天畫個框你有啥作用?”
“他們不會意識到自己是藥渣,入行(招的)就不是那種很聰明的人,很聰明的人就不會去干數據標注,你知道嗎?”他說。
數據標注員的基礎薪資也在下滑,虛假宣傳、層層外包越來越多,趙一珥覺得,行業已經開始走下坡路了;但另一方面,從業人員的素質要求在提升,基礎碎片內容要么被AI取代,要么單價極低,而更高價格的工作,對學歷和專業的要求都在上漲。
半個月前,趙一珥剛把一個單子轉給北京外國語學院的研究生團隊,那是一個涉及土庫曼斯坦語的標注,“只能找研究生來做。”
“AI也在學習。”趙一珥形容,人工智能起初是一個小學生,經受九年義務教育的人就可以教它,“但現在它越來越聰明,可能差不多是高中水平了,就需要更高學歷的去教它。”
并不是所有的AI都是聰明學生。和現實的學生一樣,“優等生”可能出自最頂級的科技公司,背后有更高級的算法、更完備的數據支持,而其他“在普通中學就讀”的AI,則沒有明顯的“智商”差異。
“在特定框架內教它還OK。”有四年工作經驗的AI訓練師宋子露說,標注最終目的是得到數據,訓練出更好的模型,而人工智能想要更好適用于場景,往往需要訓練師。“教機器人像教小孩,可能比小孩還要再笨點。”她說,教育孩子也一樣需要規則,比如“今天就是不能吃棒棒糖,哭也不能吃”。
還有一點是非常耐心地重復,宋子露還是覺得教小孩更輕松,不用重復那么多次,機器人起碼需要訓練10-15次。
這些都是楊晶晶不了解的,數據被標注后的流向——實際上,楊晶晶找到的“做老師的感覺與體面”,可能是整個人工智能行業最下游的那個。
相比之下,宋子露更像AI真正的“老師”。她也和楊晶晶這種外包數據標注員打過交道,他們曾在公司駐場工作。標注員給宋子露的感覺是壓抑的:工作時間幾乎沒有交流,很少有人說話,嚴格遵守上下班時間,像現實里被設定好程序的“機器人”。
近幾年,宋子露和趙一珥一樣,感覺行業在下滑。普通公司處境尷尬,做AI創造的價值有限,落地存在困難,放棄了又可惜,畢竟“這似乎和未來緊密相關”。
宋子露入行那幾年算是大爆發時期,但具體從什么時候,風頭漸漸過去,很難找到確切節點。而數據標注員們可以從單價上感知,1毛、8分再到4分,一條向下的折線,對于宋子露來說,就是去年年底,一個項目被臨時取消,然后她被裁員。
緊接著,自己的AI學生也被砍掉,這讓宋子露忽然對自己的價值和成就感產生了懷疑,“好像沒有在這個行業留下任何東西。”
她起初以為,哪怕到不了“桃李滿天下”,至少真的有“學生”長大成人,她甚至會幻想,自己的孩子長大之后,可以很自豪地告訴他,“這是你媽媽當年教的AI。”但事實是,AI被關閉后,宋子露再也找不到它。
ChatGPT的來臨,多少給宋子露帶來了一些信心:不少人都相信,這個行業能再度煥發生機,跟AI相關的新聞開始每天更新,世界正在飛速變化:每個行業都不可避免地要和AI打交道、AI實現商業化落地之后,需要找到客戶、落地產品,然后就到了AI訓練師的工作,這一切看起來并不遙遠。
體面
今年1月,楊晶晶回到西安定居,旅居那段時間,她喜歡上了參加交流會,一般發生在小酒館或者咖啡廳,不少人會分享自己的生活、工作和想法,這也是她為社交做出的努力。剛到西安沒幾天,她就忍不住又參加了一次交流會。
她注意到一個女孩,和她算半個教培同行,做留學工作。起初楊晶晶有點驚喜,很想和她多說幾句話,但她沒想到,在分享完自己現在的工作之后,那個女孩不斷地否定她:“你的生活方式是錯誤的。”這是楊晶晶第一次在交流會上被指責,女孩把她從頭批到腳,“你做著這樣一份不穩定的工作,自己心里也覺得不安穩。”
楊晶晶有點生氣了,她想“你和我講穩定?經過疫情,你覺得什么是穩定?大廠都有35歲的淘汰期”。但她最后沒有反駁,不想讓人難堪,她找了個借口,提前離場了。
她開始想念在成都的日子,說自己是數字游民、做標注時,楊晶晶能明顯感受到身邊好奇的眼光、覺得她很酷;而在西安,她只好退而求其次,“前教培機構從業者”,但馬上會被追問,“那現在呢?失業了嗎?”
最后她只好說是“一個簡單的地圖繪圖員”,再后來無所謂了,“我就說我是個畫圖狗。”
楊晶晶變得更沉默,也不愿意出門。實在標注不下去、不想干了,她就會逼自己看人們早高峰趕地鐵的視頻:狹小的車廂里,每個人都被擠得疲倦、失去尊嚴的樣子,只是看著就感到痛苦。楊晶晶看了一會兒,忽然又能打起精神來,爬起來繼續標注,“感覺有點變態。”
楊晶晶近期參加的交流會。講述者供圖
2月底,楊晶晶又參加了一場教育行業面試,希望有條退路。面試前,楊晶晶給自己打了預防針,覺得“他們肯定瞧不上我”,應聘者一共8人,全是前教培機構從業者,來自新東方、優勝和學而思,他們都表情熱切,急迫想要得到工作。
在那個場景里,楊晶晶忽然有個奇怪的聯想,好像去了那種帶服務的KTV,每個人都在被挑選,面試官的態度輕浮、不尊重,一律把他們都歸為“搞應試教育的”,并要求上班時間是下午1點到凌晨12點。其他人都忍了下來,她有些崩潰了,為什么會是這樣的?她強迫自己留下,但表現得很不耐煩,差點和面試官吵起來。
那之后兩個星期,楊晶晶沒再出門,她不得不承認,還是受到了一些打擊。生活變得只剩下標注一件事,她開始嘗試著在標注公司帶幾個“學徒”,這起碼又是老師了。
但糾結和焦慮總會突然刺痛她,就像標注圖片上一團亂麻的線條,半個月前,楊晶晶又換了個項目,工作也停了幾天,她解釋:“AI越來越聰明,原本類型的數據升級了,要更新項目。”某個下午,壓力堆到一起,楊晶晶覺得太憋悶,她已經很久沒有和人說話了,除了扔垃圾,連門都不怎么出。她趕緊又投了一份簡歷。
幾天后,楊晶晶接到了面試通知,職位是高考志愿規劃師。她面試表現得不錯,但要求6000元無責保底月薪,提成按志愿單量給,和她競爭的另一個女孩,研究生剛畢業,只要4000元底薪就干。
很快,楊晶晶收到了拒絕回復,她無可奈何,“那個女孩還要租房,四千塊錢怎么也愿意?工資就是這樣被卷下來的。”
她又回到了標注的生活。一個好消息是,ChatGPT的火熱是個明確機會,因為只有通過大量的數據標注,才能對AI進行算法訓練,“這是一個前置動作。”楊晶晶還有另一個邏輯,哪怕AI學習能力再提高,那些最基礎的工作沒有幾年也標不完,“我們國家這么大,光方言就有多少種。”
這讓楊晶晶開始著手做培訓了,先從社交賬號開始,在“同城找工作”、“副業兼職”話題下,她發了幾個帖子:基礎地圖繪制,可遠程兼職,帶徒陪跑。3-5天上手。西安附近可面談。她錄制了視頻作為教學參考,簡單講解了些數據標注內容,配文“我只工作不上班”,標簽“努力工作快樂生活”,還建了自己的培訓群,在里面答疑解惑,分享一些簡單的標注項目轉單。
重新和人打交道,楊晶晶終于找回了那份久違的體面——視頻評論區,一個加了她培訓群的網友留言:“特別好,這兩百花得值,以后要開始副業賺錢了,謝謝楊老師。”
(文中講述者為化名)
責任編輯: