NLP(Neuro Linguistic Programming,身心、語(yǔ)法、程序等)語(yǔ)義分析目前在大數(shù)據(jù)領(lǐng)域炙手可熱的話題。任何對(duì)語(yǔ)言的理解都可以歸為語(yǔ)義分析的范疇。一段文本通常由詞、句子和段落來(lái)構(gòu)成,根據(jù)理解對(duì)象的語(yǔ)言單位不同, 語(yǔ)義分析又可進(jìn)一步分解為詞匯級(jí)語(yǔ)義分析、句子級(jí)語(yǔ)義分析以及篇章級(jí)語(yǔ)義分析。語(yǔ)義分析目標(biāo)就是通過(guò)建立有效的模型和系統(tǒng), 實(shí)現(xiàn)在各個(gè)語(yǔ)言單位的自動(dòng)語(yǔ)義分析,從而實(shí)現(xiàn)理解整個(gè)文本表達(dá)的真實(shí)語(yǔ)義。

最近做的項(xiàng)目需要通過(guò)NLP分析用戶評(píng)論,根據(jù)用戶評(píng)論確定是否商品有質(zhì)量問(wèn)題,進(jìn)而確認(rèn)是哪類質(zhì)量問(wèn)題,更進(jìn)一步給這條評(píng)價(jià)打上標(biāo)簽。項(xiàng)目時(shí)間比較緊張,甚至項(xiàng)目的進(jìn)度安排受到質(zhì)疑,項(xiàng)目節(jié)奏一旦確認(rèn),強(qiáng)力推進(jìn),這本是我的工作范疇。但我實(shí)在低估了NLP從模型化到準(zhǔn)確率提升難度其實(shí)挺大。隨著項(xiàng)目進(jìn)行,風(fēng)險(xiǎn)也在逐步加大,但項(xiàng)目目標(biāo)經(jīng)過(guò)滾動(dòng)式規(guī)劃越來(lái)越清晰。從外包團(tuán)隊(duì)標(biāo)記語(yǔ)料,到模型搭建優(yōu)化,到歸類,到BAD CASES分析處理,到關(guān)鍵詞規(guī)則全套匯總,一環(huán)扣一環(huán)。數(shù)據(jù)源有兩種,一種是真實(shí)用戶記錄的,一種是內(nèi)部人員記錄的。不確定性在于技術(shù)認(rèn)為這兩種數(shù)據(jù)源可以使用同一套數(shù)據(jù)模型解析。做的過(guò)程中才發(fā)現(xiàn)這兩個(gè)數(shù)據(jù)源不能通過(guò)一種模型實(shí)現(xiàn)解析,于是技術(shù)就用了四個(gè)模型。此時(shí),應(yīng)該采用原型法介入了。

中期項(xiàng)目風(fēng)險(xiǎn)確實(shí)比較大,項(xiàng)目中期產(chǎn)品技術(shù)與業(yè)務(wù)方進(jìn)行了一次深入溝通,就項(xiàng)目目標(biāo)再次重申,明確兩種數(shù)據(jù)類型需要分開處理,準(zhǔn)確率目標(biāo)也不盡相同。本期上線目標(biāo)是系統(tǒng)流程打通,同時(shí)保證一種數(shù)據(jù)源成功率,確保大分類數(shù)據(jù)準(zhǔn)確,二級(jí)分類可以分迭代執(zhí)行,當(dāng)然這個(gè)與業(yè)務(wù)方期望一致。這樣的迭代升級(jí)計(jì)劃是項(xiàng)目組是需要制訂的,不能光說(shuō)不能搞定,還得有接下來(lái)搞定的計(jì)劃怎樣,這才是一種正確的做法。

接入NLP分析,細(xì)化工作任務(wù)。在前期準(zhǔn)確率不能提升的情況下,怎樣驗(yàn)收,模擬現(xiàn)有人工操作讓流程跑起來(lái)同樣重要。有時(shí)候開發(fā)說(shuō)很快其實(shí)是個(gè)偽命題,做過(guò)程序員的朋友都應(yīng)該知道一個(gè)話題,等我?guī)追昼娚踔潦昼?,恐怕一兩個(gè)小時(shí)都沒有了,項(xiàng)目經(jīng)理對(duì)程序員的“快速承諾”往往會(huì)比較謹(jǐn)慎,可以輸出需要做哪些事情,需要哪些外部輸入和內(nèi)部數(shù)據(jù)準(zhǔn)備,臨時(shí)抱佛腳其實(shí)是比較慘的。這也是項(xiàng)目經(jīng)理需要留意的地方,可能你面對(duì)的是開發(fā)負(fù)責(zé)人,而開發(fā)負(fù)責(zé)人不是最終的執(zhí)行開發(fā)人員,這中間的溝通斷層有時(shí)候會(huì)出問(wèn)題,溝通討論具體執(zhí)行計(jì)劃,與實(shí)際對(duì)接人溝通顯得尤為重要。

下游系統(tǒng)的對(duì)接,接口之間要明確,技術(shù)負(fù)責(zé)人需要仔細(xì)評(píng)審,項(xiàng)目經(jīng)理可以抽查,尤其是可能出問(wèn)題系統(tǒng)之間的交互,從產(chǎn)品技術(shù)測(cè)試的角度全面出擊,確保上下游數(shù)據(jù)對(duì)接好,核心流程經(jīng)歷過(guò)開發(fā)聯(lián)調(diào)、測(cè)試聯(lián)調(diào)等,回歸保證現(xiàn)有流程不受到影響。

安全評(píng)審、用例評(píng)審、上線評(píng)審、發(fā)布時(shí)間都還是要對(duì)齊,上線后驗(yàn)收用例也可安排評(píng)審,第一時(shí)間留下產(chǎn)品經(jīng)理,和研發(fā)團(tuán)隊(duì)一起驗(yàn)收,這非常重要。每個(gè)人手頭上有很多事情,項(xiàng)目經(jīng)理就是他們的指示牌,你最了解這個(gè)項(xiàng)目的整體計(jì)劃和時(shí)間緊迫性,而他們則有自己的需求和事情優(yōu)先級(jí),提早進(jìn)行規(guī)劃,確保大家全力支撐,做到心往一處想和勁往一處使。

跨地區(qū)和跨團(tuán)隊(duì)本來(lái)就是溝通中的難題,該溝通一定要第一時(shí)間溝通,確保雙方理解一致,充分利用現(xiàn)代高科技,雙方理解一致,深入溝通,而不是“我以為”,這在后期就是借口了。有風(fēng)險(xiǎn)也不必第一時(shí)間通過(guò)領(lǐng)導(dǎo)傳遞出去,你有自己的思想,有自己的計(jì)劃,這個(gè)層級(jí)全方位考慮已顯得特別重要,不然也挺難更進(jìn)一步的。

當(dāng)然,知道各個(gè)團(tuán)隊(duì)需求列表,項(xiàng)目資源的情況,了解到關(guān)鍵路徑上的排期,整個(gè)節(jié)奏按這個(gè)對(duì)齊,同時(shí)跟開發(fā)負(fù)責(zé)人協(xié)調(diào)資源,其實(shí)都是要努力爭(zhēng)取的。對(duì)于一些申請(qǐng)的特別臨時(shí)資源,要關(guān)注風(fēng)險(xiǎn),確保長(zhǎng)期關(guān)注,周計(jì)劃要明確,每日重點(diǎn)要第一時(shí)間關(guān)注,對(duì)于自管理團(tuán)隊(duì)也要看其成熟度,磨合階段的效果一定不會(huì)太好,拉群,隨時(shí)問(wèn)候,每日同步都非常重要。

一旦確立目標(biāo),全力以赴,一起搞清楚要做的事情,拉上專家一起,勢(shì)必在項(xiàng)目初期就識(shí)別風(fēng)險(xiǎn),不要到最后各處救火。滾動(dòng)式規(guī)劃很重要,公司同事都是愿意做好事情的,這一點(diǎn)非常重要。事因難能,所以可貴,能夠在很短時(shí)間里靠集體的力量完成這個(gè)難度還蠻高的項(xiàng)目本來(lái)就不容易。上線后持續(xù)迭代,上線后回顧都顯得尤其重要,NLP尤其需要重點(diǎn)留意,全力以赴沖刺,上線一個(gè)比較好的效果,能夠幫忙公司,這本來(lái)就是一件美好的事情,感謝、感激、感恩大家那一個(gè)個(gè)奮斗的夜晚和周末,一起繼續(xù)加油,爭(zhēng)取早日可運(yùn)營(yíng)!

最后要說(shuō)下個(gè)人收獲最大的經(jīng)驗(yàn)教訓(xùn)了,目標(biāo)一旦確定勢(shì)必全力以赴。后續(xù)項(xiàng)目有則改之,無(wú)則加勉。從各個(gè)緯度:

1. 需求階段即識(shí)別最關(guān)鍵路徑,包括技術(shù)風(fēng)險(xiǎn),拉主要負(fù)責(zé)人一起討論應(yīng)對(duì)之策,滾動(dòng)式規(guī)劃,搞不定也得有計(jì)劃。最大的技術(shù)風(fēng)險(xiǎn)看其他同事怎樣幫助,充分利用業(yè)務(wù)方的期盼和技術(shù)同事的主觀能動(dòng)性。一起感受到業(yè)務(wù)的期盼。

2. 大數(shù)據(jù)模型迭代需要一個(gè)較長(zhǎng)的時(shí)間,這一點(diǎn)不僅要讓自己明白,也需要讓產(chǎn)品和技術(shù),尤其是關(guān)鍵的業(yè)務(wù)明白,有計(jì)劃地推進(jìn)落地。做出來(lái)計(jì)劃,分解出WBS。不要等上面催促的時(shí)候才回復(fù),有計(jì)劃,有安排,這也非常重要。

3. 申請(qǐng)到新團(tuán)隊(duì)資源,一定要留意有個(gè)磨合的過(guò)程。這個(gè)需要作為項(xiàng)目的風(fēng)險(xiǎn),一直觀察,團(tuán)隊(duì)組建到成熟高產(chǎn)出,需要時(shí)間。多溝通,各種形式狂轟濫炸。當(dāng)前,快速申請(qǐng)資源本身還是不錯(cuò)的,這個(gè)值得嘉獎(jiǎng),從上往下得到領(lǐng)導(dǎo)支持非常重要。

4. 遠(yuǎn)程團(tuán)隊(duì)需要跟負(fù)責(zé)人建好,提前溝通加班安排。緊密每周溝通,尤其是在聯(lián)調(diào)的關(guān)鍵時(shí)期,索性本次并沒有掉鏈子。產(chǎn)品和實(shí)際開發(fā)要多溝通,避免技術(shù)負(fù)責(zé)人太忙,以至于信息有斷層。

5. 安全評(píng)審和上線驗(yàn)收要提前準(zhǔn)備,通知產(chǎn)品經(jīng)理,同時(shí)號(hào)召各產(chǎn)品線準(zhǔn)備好驗(yàn)收?qǐng)鼍昂退枰臄?shù)據(jù),權(quán)限,確保干系人都在場(chǎng),否則沒法搞了。測(cè)試有理由不上線,因?yàn)闆]有產(chǎn)品經(jīng)理驗(yàn)收。

6. 對(duì)需要進(jìn)行數(shù)據(jù)初始化的項(xiàng)目,一定要確認(rèn)好初始化的數(shù)據(jù),需要的時(shí)間,各下游系統(tǒng)的準(zhǔn)備,都需要規(guī)劃好??梢院蜕暇€并行地搞,這樣才不至于后期被動(dòng),這個(gè)也是非常重要的。

再次回顧下墨菲定律,你越不想某件事情發(fā)生,某件事情就越會(huì)發(fā)生。比如這次半夜上線推遲到第二天中午,進(jìn)一步推遲到第二天下午,是因?yàn)閾?dān)心半夜發(fā)布的風(fēng)險(xiǎn)和發(fā)現(xiàn)新問(wèn)題所致;比如驗(yàn)收過(guò)程中導(dǎo)入數(shù)據(jù),以為一切就緒,發(fā)現(xiàn)走HIVE的時(shí)間也是好幾個(gè)小時(shí),手工拼裝數(shù)據(jù)也并非想象中那么容易,一個(gè)多小時(shí)硬是變成了半天;比如NLP準(zhǔn)確率從頭到尾都是一個(gè)問(wèn)題,一開始懵懵懂懂到最后逐步清晰,這其實(shí)可以更要讓其發(fā)生,雖然已盡全力,但著實(shí)沒有辦法,晚兩周發(fā)布會(huì)不會(huì)更好。

期望自己能夠繼續(xù)成長(zhǎng),積累心得,下一個(gè)項(xiàng)目少走彎路。有并行思維而非串行思維,這同樣重要。項(xiàng)目在每天和每周最重要的事情都需要羅列下,這就是項(xiàng)目周報(bào)、項(xiàng)目里程碑的意義,這些內(nèi)容隨時(shí)可供自己參考,也方便干系人了解項(xiàng)目最新的狀態(tài)。

版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請(qǐng)發(fā)送郵件至 sumchina520@foxmail.com 舉報(bào),一經(jīng)查實(shí),本站將立刻刪除。

相關(guān)新聞

聯(lián)系我們

聯(lián)系我們

400-9010-860

在線咨詢:點(diǎn)擊這里給我發(fā)消息

微信:85018612

商夢(mèng)建站客服

工作時(shí)間:周一至周六

9:00-18:30,節(jié)假日休息

關(guān)注微信
關(guān)注微信
分享本頁(yè)
返回頂部