米格抖音培訓網-百科問答 > 抖音最新日活超3.2億,字節跳動資深算法架構師深度解剖抖音推薦機制!

抖音最新日活超3.2億,字節跳動資深算法架構師深度解剖抖音推薦機制!

發布日期:2019-07-12 21:49來源:米格抖音培訓網我來投稿

  近日,字節跳動公布了最新數據,引發的關注比微信前幾天的新版本要高得多:抖音日活突破3.2億,字節跳動旗下產品總日活超過7億,全球月活超過15億。

抖音最新日活超3.2億,字節跳動資深算法架構師深度解剖抖音推薦機制!

  ▲ 抖音官方海報

抖音最新日活超3.2億,字節跳動資深算法架構師深度解剖抖音推薦機制!

  ▲ 抖音用戶增長圖

  我們都知道,抖音的成功,背后離不開字節跳動旗下獨特的算法機制。

  網上流傳著許許多多抖音的推薦機制,亂七八糟,孰真孰假難分辨。

  7月9-10日,字節跳動資深算法架構師曹歡歡,在“2019WISE超級進化者”大會上給出了關于推薦機制的正確答案。

抖音最新日活超3.2億,字節跳動資深算法架構師深度解剖抖音推薦機制!

  搞懂這套算法機制,或許就離百萬爆款視頻不遠了。

  以下為嘉賓演講實錄:

  今天和大家分享一下算法推薦如何幫助用戶去拓展興趣。

  很多朋友看到這個話題,覺得有一點意外。因為算法推薦是一個新東西,大規模的應用也就是最近幾年。有一個規律,一個新生事物會由于外界很多人對它不夠了解,而產生一些誤解。

  對算法推薦來講有一個常見誤解,有些人認為算法推薦讓用戶的興趣窄化。這背后的邏輯是,算法推薦很懂你,根據你的興趣推薦,只推薦用戶感興趣的東西,這個用戶看的內容始終在一個有限的范圍內。長久以后,用幾年推薦系統,你的見識、知識、見解得不到提高。

  為什么這是一種誤解呢?有這種想法,是因為很多人不了解算法工程師,也對算法推薦系統不夠了解。

  聰明算法工程師都不希望自己的用戶興趣窄化,就像沒有一個商場的經理,希望顧客每一次來到商場都只關注同一類別的商品。商場經理都希望顧客關注盡可能多的產品品類,算法工程師也希望用戶盡可能的拓展自己的興趣。

  1、推薦系統一定是智能、可學習的系統

  推薦系統本質上一定是基于海量內容的,就是內容一定要多,如果只有十條內容,沒有辦法推薦。有很多內容,不知道你喜歡哪個,讓系統做,這樣可以節省用戶的精力和時間。

  從海量內容挑選用戶感興趣的內容,所以推薦系統一定是智能、可學習的系統,并且會根據用戶的反饋調整自己。這些反饋有很多,比如在電商領域,是下單、添加到購物車,在內容領域是點擊,在短視頻領域是播放。

  推薦系統通過種種正向、負向反饋,不斷觀察學習,根據這些信號不斷調整自己,讓自己更能符合用戶的興趣需求,這就是一個推薦系統的本質。

  業內最早應用推薦系統的行業是電影。

  早在2006年,當時還在賣DVD的Netflix就曾經發起過一次獎金高達百萬的大賽,比賽內容就是說誰能發明比他現有電影推薦算法好10%的方法,就能得到百萬美金。

  推薦系統在資訊領域的應用,其實是比較晚的,今日頭條應該是全世界范圍內第一個做的。我加入頭條比較早,在2014年初。在頭條之前,行業里有一些個性化推薦的方案,但是都要基于興趣訂閱。

  更早的,像谷歌的閱讀器,都需要用戶進行很煩瑣訂閱一堆來源或者標簽。完全實現系統自動學習推薦,今日頭條是全世界第一家。

  不同行業的推薦系統,雖然應用領域、場景不太一樣,但本質是類似的。

  所有的推薦系統都需要依靠三個方面的特征:內容特征、用戶特征、環境特征,系統需要結合這三方面的信息做決策。

  用戶特征,是指用戶的標簽,包括用戶注冊時提交的基本信息,比如性別、年齡,還有用戶在平臺上的動作,比如用戶歷史點擊的文章列表、文章的關鍵詞分布、文章的作者分布等信息。

  內容特征,如果它是個商品,要有分類、標簽,包括歷史購買評論,這些都很重要。對于內容來講,就是它的文本、主題、關鍵詞等信息。

  環境特征,就是環境信息,對于用戶來講,他的興趣很多時候會變化,有的會周期性變化。比如一個資訊APP用戶,上班期間和上班路上、下班休息的時候,興趣是有變化的。

  這些特征信息推薦系統是要考慮到的。但是在不同領域、不同的推薦系統考慮的側重點有所區別。總體來講,所有的推薦系統都必須基于這三方面的信息來決策。

  應該還沒有一個系統,用這三方面之外的特征信息,所以這個概括還是比較全面的。

  2、推薦內容多樣性越好

  用戶長期留存概率越大

  大家對推薦系統的基本概念了解之后,可能會想到一個問題,作為推薦系統的開發者,是怎么設計推薦系統的,推薦系統的目標是什么?

  從推薦系統設計者和運營者有不同層次的目標,有短期目標、中期目標、長期目標。

  長期目標。運營一個業務,希望提升用戶的長期黏性,希望用戶用了今日頭條等應用之后,能一直用下去,成為我們的忠實用戶。一方面用戶體驗很好,它才會長期用。

  從企業來講,長期的收入就有了保障,這肯定是長期目標。長期目標對于算法、模型來講是非常難學的。越是長期目標,機器學習難度越大。

  所以又有一些中期目標,比如用戶下周或者下月還來用。在短期窗口內提高它的黏性,這也很難,但是業內也有一些探索,比如強化學習的學習范式,而不用監督學習。但是也比較難,目前還不是特別成熟。

  技術最成熟的是短期目標,短期目標就是用戶短時間內對用戶的反饋。給用戶推了一篇文章,用戶有沒有點開、點贊。抖音推的短視頻,有沒有播放、點贊、分享。這些短期目標模型是非常容易學習,容易建立起用戶行為。

  短期目標和長期目標的關系,有正相關性,又不能完全用短期目標代替長期目標。根據我們的觀察發現,推薦內容的多樣性越好,用戶的長期留存概率越大。

  如果只是推高熱內容,用戶短時間也點擊,也停留了,今天看了也很爽。但是內容的多樣性不好,很單一,用戶的長期留存就很差。

  這和我上面提到的商場的類比一樣。一個喜歡鞋子的用戶,假如每次來商場都能快速買到自己喜歡的鞋子,用戶的單次消費就很開心,但最終用戶會減少來這個商場的消費次數,除非他又產生了買鞋子的需求。

  要把用戶長期留存下來,就要穿透他的興趣,拓展他的視野,讓他衣服、飲食、看電影這些消費,都在商場里完成。

  所以從推薦系統設計者來講,非常希望推薦系統既短期數據有很好的表現,也希望推的內容是多樣化的,能滿足用戶多個興趣點。

  甚至我們需要挖掘用戶更多的興趣點,盡量在一個平臺上滿足用戶更多的興趣點。所以做內容的多樣性,也是我們的需要。

  頭條在資訊推薦領域算是先行者,這塊也積累了很多經驗。如果大家是頭條的老用戶,應該會發現,看到的內容是非常多樣化的。

  3、推薦系統如何探索更多用戶興趣

  那么接下來說說我們在推薦系統里是如何做到探索用戶更多的興趣方向,并且避免內容推薦的過于單一的。

  從策略上講,推薦系統會有消重和打散策略。

  所有的內容在推薦之前,會進行各種層次的相似性分析,會識別哪兩篇文章或者視頻是非常類似的。比如可能兩篇文章,雖然遣詞造句不一樣,但是講的內容是一樣的。

  推薦系統能夠分析哪些文章講的是同一個事情,或者涉及到同一個人,或者涉及到某一個公司,基于他們各種各樣的特征進行分析。

  然后,推薦的時候,系統會根據不同的相似性對這些相關的文章進行不同的處理。對于相似的文章,如果給用戶推薦了文章A,跟文章A相似的其他文章就不會被推薦了,這個就是消重的策略。

  那么還有一種情況,就是同一個方向或同一類主題的文章,比如都是足球的文章,推薦系統就需要打散策略,來保證推薦的頻率不會太高,避免用戶在前端感覺內容的同質化,保證內容多樣性,這些都是有算法保證的。

  除了消重和打散策略,我們還會留一部分比例流量,探索用戶的興趣。

  甚至,我們會犧牲短期目標,比如每幾刷,或有一刷的位置就是探索用戶的興趣,推薦一些模型不確認用戶是不是感興趣,但是模型想探索一下,會有一些這樣的流量。

  然后就是從推薦模型本身來講,最古老的推薦模型是協同過濾,這是十幾年前的老一代技術,那時候大家就已經在考慮拓展用戶的興趣了。因為給用戶推一樣的東西,用戶肯定會流失。

  協同過濾的做法也非常簡單、直觀,推薦系統會考慮你跟哪個用戶比較像,你們都點了什么,你們喜歡同一類的電影,然后把那個人看過的,但你還沒看過的內容推薦給你,通過相似用戶的手段實現了興趣的探索。

  現在還有很多高端技術也在探索用戶興趣,推動內容多樣性。現在主流的技術是用深度學習做推薦,在深度學習里面有很多方法,包括網絡可以做一些特殊的設置,讓它學一些新東西。

  深度學習還是比較容易做的,因為所有用戶、所有內容都是高維空間的向量,可以有意識引導模型,讓它學習一些可能感興趣的內容,雖然它的興趣標簽和你不一樣。

  但是在這個空間里面,映射到很近的點,讓模型容易推出去,這里面有很多高端的做法。

  最后還有一個重要的手段,我們給用戶推出的是一個APP,是一個完整產品。很多人擔憂推薦算法,就算你有這么多手段,還是不能很好測量我的興趣,不能探索出我的更多興趣。

  作為產品來講,它有很多功能,比如今日頭條,我們也做了很多功能來幫助大家拓展興趣。

  比如熱點,包括地震類的重要新聞,以及其他類的小眾熱點新聞,我們也會直接推薦給大家,我們會做很多精美的專題,背后有很多運營團隊去做。

  比如關注,過去兩年,我們在UGC也重點發力,也做得非常好,涵蓋了基本上各個行業的名人、大V。

掃一掃關注短視頻培訓網公眾號

版權聲明:本文內容由互聯網用戶自發貢獻,本站不擁有所有權,不承擔相關法律責任。如果發現本站有涉嫌抄襲的內容, 歡迎發送郵件至 [email protected]舉報,并提供相關證據,一經查實,本站將立刻刪除涉嫌侵權內容。

作者:admin

相關文章

01
02
03
04
zcw中彩网