什么是內(nèi)容興趣偏好標簽?zāi)?
簡單來說就是分析用戶喜歡看的文章類型,得到用戶的興趣偏好,在這樣的基礎(chǔ)上,對用戶進行內(nèi)容的個性化推薦和push推送,來有效促進app的活躍并拉長用戶生命周期。
這件事情簡單來說其實就是兩步走:
一是,給文章進行分類,也就是我們俗稱的給文章打標簽。
二是,給用戶打標簽,也就是用戶閱讀了哪些類型的文章,相應(yīng)的就會獲取到自己的興趣偏好標簽。比如我愛看科技類型的文章,那我便有極大的可能被打上科技的資訊標簽。
那么,在實踐中真的這么簡單嗎?看似簡單的兩個鏈接究竟是如何工作的?
首先,文章的人工標注,優(yōu)點是準確,缺點是效率低,因為算法需要大量樣本,成本非常高。
另一種方法是通過一些開源網(wǎng)站提供模型訓(xùn)練的關(guān)鍵詞,如可以從搜狗詞典中獲得,優(yōu)點是成本低,但缺點也很明顯,因為不同的分類系統(tǒng)對部分分類有不同的理解,分類不夠準確,后期需要大量的人力來修正。
給用戶打標簽的方式其實也可以包含兩種,統(tǒng)計類的打標簽及算法類的打標簽。統(tǒng)計類相對簡單粗暴式的以用戶一段時間閱讀的文章類型作為用戶的興趣偏好。而算法類則會增加更多的影響因素,包括文章閱讀的數(shù)量,閱讀的時間間隔,文章與當前熱點事件的關(guān)系、用戶屬性因素等等。
前者在算法資源不足同時運營需求量大的情況下可以先行,而后者可以在前者的基礎(chǔ)上切分一部分流量對算法模型進行驗證和調(diào)整,不斷優(yōu)化。
但在用第一種方式進行時我們發(fā)現(xiàn),用戶在一段時間內(nèi)閱讀的文章類型并不是穩(wěn)定的,大部分用戶會有一個或者幾個主要的興趣偏好,這些類型閱讀的文章篇數(shù)會更多,但同時,用戶也會或多或少的閱讀一些其他類型的文章,甚至有些用戶是看到哪里算哪里,什么都會看。
基于這樣的情況,我們需要對用戶的興趣偏好進行排名,即通過對用戶一段時間內(nèi)每種文章類型閱讀的文章數(shù)進行排名,并取用戶top10的標簽,清晰告訴運營用戶喜歡什么類型的文章,這些類型中,用戶喜歡類型的優(yōu)先級是怎樣的,便于運營同學(xué)進行推送選擇。
以上便是對APP如何給用戶打標簽&內(nèi)容推送這一問題的淺談,若您想了解更多細節(jié),聯(lián)系重慶分母智慧科技,我司將為您提供更專業(yè)更細致的解答。