• / 14
  • 下載費用:30 金幣  

一種確定視頻相似度的方法及裝置.pdf

關 鍵 詞:
一種 確定 視頻 相似 方法 裝置
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
摘要
申請專利號:

CN201410263951.8

申請日:

2014.06.13

公開號:

CN104053023A

公開日:

2014.09.17

當前法律狀態:

實審

有效性:

審中

法律詳情: 實質審查的生效IPC(主分類):H04N 21/258申請日:20140613|||公開
IPC分類號: H04N21/258(2011.01)I; H04N21/466(2011.01)I 主分類號: H04N21/258
申請人: 海信集團有限公司
發明人: 張帥; 高雪松; 周翚; 于旭; 胡偉鳳; 王浩; 謝杰; 許麗星
地址: 266100 山東省青島市嶗山區株洲路151號
優先權:
專利代理機構: 北京同達信恒知識產權代理有限公司 11291 代理人: 黃志華
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201410263951.8

授權公告號:

|||

法律狀態公告日:

2014.10.22|||2014.09.17

法律狀態類型:

實質審查的生效|||公開

摘要

本發明實施例公開了一種確定視頻相似度的方法及裝置,本發明實施例的方法包括:獲取對視頻具有操作行為的用戶及用戶數量;根據不同的操作行為,將所述視頻以及與所述視頻對應的用戶及用戶數量劃分不同集合;根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度;根據所述第一視頻和第二視頻的操作相似度以及第一視頻和第二視頻的內容相似度,得到第一視頻和第二視頻的視頻相似度。本發明實施例通過將視頻之間的操作相似度和內容相似度結合起來確定視頻相似度,根據視頻相似度,得到某一視頻的一系列相關視頻的整體排名,向用戶推薦排名結果靠前的視頻。

權利要求書

1.  一種確定視頻相似度的方法,其特征在于,包括:
獲取對視頻具有操作行為的用戶及用戶數量;
根據不同的操作行為,將所述視頻以及與所述視頻對應的用戶及用戶數量劃分不同集合;
根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度;
根據所述第一視頻和第二視頻的操作相似度以及第一視頻和第二視頻的內容相似度,得到第一視頻和第二視頻的視頻相似度。

2.
  如權利要求1所述的方法,其特征在于,所述根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度,具體為:
針對一個集合,根據所述集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的相似度;
根據各個集合對應的第一視頻和第二視頻的相似度,得到第一視頻和第二視頻的操作相似度。

3.
  如權利要求2所述的方法,其特征在于,所述根據所述集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的相似度,具體為:
根據以下方式確定所述集合對應的第一視頻和第二視頻的相似度:
sim1i(j,k)=nj,kmax{nj,k|j,k∈Siandj≠k}]]>
其中,sim1i(j,k)為所述集合對應的第一視頻j和第二視頻k的相似度,Si為所述集合對應的所有視頻集,j’、k’為任意兩部視頻,nj,k為對第一視頻j和第二視頻k都存在相同操作行為的用戶數量,nj’,k’為對任意兩部視頻j’和k’都存在相同操作行為的用戶數量。

4.
  如權利要求2所述的方法,其特征在于,所述根據各個集合對應的第一視頻和第二視頻的相似度,得到第一視頻和第二視頻的操作相似度,具體為:
根據各個集合對應的第一視頻和第二視頻的相似度,以及各個集合對應的相似度權重,確定第一視頻和第二視頻的操作相似度。

5.
  如權利要求1所述的方法,其特征在于,所述第一視頻和第二視頻的內容相似度的獲取方式具體為:
sim2(j,k)=v→j·v→k||v→j||||v→k||]]>
其中,sim2(j,k)為第一視頻和第二視頻的內容相似度,向量的屬性中包括第一視頻的內容信息,向量的屬性中包括第二視頻的內容信息。

6.
  一種確定視頻相似度的裝置,其特征在于,包括:
獲取信息模塊,用于獲取對視頻具有操作行為的用戶及用戶數量;
確定操作相似度模塊,用于根據不同的操作行為,將所述視頻以及與所述視頻對應的用戶及用戶數量劃分不同集合;根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度;
確定視頻相似度模塊,用于根據所述第一視頻和第二視頻的操作相似度以及第一視頻和第二視頻的內容相似度,得到第一視頻和第二視頻的視頻相似度。

7.
  如權利要求6所述的裝置,其特征在于,所述確定操作相似度模塊還用于:
針對一個集合,根據所述集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的相似度;
根據各個集合對應的第一視頻和第二視頻的相似度,得到第一視頻和第二視頻的操作相似度。

8.
  如權利要求7所述的裝置,其特征在于,所述確定操作相似度模塊還 用于:
根據以下方式確定所述集合對應的第一視頻和第二視頻的相似度:
sim1i(j,k)=nj,kmax{nj,k|j,k∈Siandj≠k}]]>
其中,sim1i(j,k)為所述集合對應的第一視頻j和第二視頻k的相似度,Si為所述集合對應的所有視頻集,j’、k’為任意兩部視頻,nj,k為對第一視頻j和第二視頻k都存在相同操作行為的用戶數量,nj’,k’為對任意兩部視頻j’和k’都存在相同操作行為的用戶數量。

9.
  如權利要求7所述的裝置,其特征在于,所述確定操作相似度模塊還用于:
根據各個集合對應的第一視頻和第二視頻的相似度,以及各個集合對應的相似度權重,確定第一視頻和第二視頻的操作相似度。

10.
  如權利要求6所述的裝置,其特征在于,所述確定視頻相似度模塊還用于:
根據以下方式確定所述第一視頻和第二視頻的內容相似度:
sim2(j,k)=v→j·v→k||v→j||||v→k||]]>
其中,sim2(j,k)為第一視頻和第二視頻的內容相似度,向量的屬性中包括第一視頻的內容信息,向量的屬性中包括第二視頻的內容信息。

說明書

一種確定視頻相似度的方法及裝置
技術領域
本發明涉及通信技術領域,尤其涉及一種確定視頻相似度的方法及裝置。
背景技術
隨著網絡視頻平臺和數字電視的普及,可供用戶選擇的視頻越來越多,如何選擇視頻日漸成為廣大用戶面臨的一個普遍問題。
智能視頻推薦系統通過確定視頻之間的相似度,進而根據相似度的大小向用戶推薦視頻。在現有的智能視頻推薦系統中,確定視頻之間的相似度時,通常只考慮從視頻基礎信息方面或者從用戶的喜好方面進行視頻相似度的計算。例如,通過收集視頻的描述信息形成視頻基礎信息數據,包括:視頻名稱、導演、主演、視頻類型等;通過收集用戶的訪問行為信息統計分析出用戶的喜好,形成用戶行為分析數據,包括:各個用戶最喜愛的導演排行、視頻類型排行等;進而根據用戶的推薦內容請求,向用戶發送推薦結果。
從視頻基礎信息方面進行視頻推薦時,在視頻數量較少的情況下,各個視頻的基礎信息可能會存在很大差異,此種情況下,無法得到合理的推薦結果;從用戶的喜好方面進行視頻推薦時,對于新加入的用戶來說,無法準確分析出新加入用戶的喜好,也會導致無法得到合理的推薦結果。另外,采用上述方法計算視頻相似度時,只側重于一個方面,用戶在發送一個推薦內容請求時,往往得到僅在一個角度上具有相似性的相關視頻,例如,僅根據視頻基礎信息得到的具有相似性的相關視頻,或者僅從用戶的喜歡方面得到的具有相似性的相關視頻,從而導致推薦的視頻準確性不高,難以吸引用戶的注意力。
發明內容
本發明提供根據一種確定視頻相似度的方法及裝置,用以解決現有的智能視頻推薦系統中確定視頻相似度時,只從視頻內容方面或者視頻觀看者自己的喜好方面來考慮,從而導致推薦的視頻準確性不高的技術問題。
本發明實施例提供一種確定視頻相似度的方法,包括:
獲取對視頻具有操作行為的用戶及用戶數量;
根據不同的操作行為,將所述視頻以及與所述視頻對應的用戶及用戶數量劃分不同集合;
根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度;
根據所述第一視頻和第二視頻的操作相似度以及第一視頻和第二視頻的內容相似度,得到第一視頻和第二視頻的視頻相似度。
較佳地,所述根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度,具體為:
針對一個集合,根據所述集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的相似度;
根據各個集合對應的第一視頻和第二視頻的相似度,得到第一視頻和第二視頻的操作相似度。
較佳地,所述根據所述集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的相似度,具體為:
根據以下方式確定所述集合對應的第一視頻和第二視頻的相似度:
sim1i(j,k)=nj,kmax{nj,k|j,k∈Siandj≠k}]]>
其中,sim1i(j,k)為所述集合對應的第一視頻j和第二視頻k的相似度,Si為所述集合對應的所有視頻集,j’、k’為任意兩部視頻,nj,k為對第一視頻j和第二視頻k都存在相同操作行為的用戶數量,nj’,k’為對任意兩部視頻j’和k’都存在相同操作行為的用戶數量。
較佳地,所述根據各個集合對應的第一視頻和第二視頻的相似度,得到第一視頻和第二視頻的操作相似度,具體為:
根據各個集合對應的第一視頻和第二視頻的相似度,以及各個集合對應的相似度權重,確定第一視頻和第二視頻的操作相似度。
較佳地,所述第一視頻和第二視頻的內容相似度的獲取方式具體為:
sim2(j,k)=v→j·v→k||v→j||||v→k||]]>
其中,sim2(j,k)為第一視頻和第二視頻的內容相似度,向量的屬性中包括第一視頻的內容信息,向量的屬性中包括第二視頻的內容信息。
本發明提供一種確定視頻相似度的裝置,包括:
獲取信息模塊,用于獲取對視頻具有操作行為的用戶及用戶數量;
確定操作相似度模塊,用于根據不同的操作行為,將所述視頻以及與所述視頻對應的用戶及用戶數量劃分不同集合;根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度;
確定視頻相似度模塊,用于根據所述第一視頻和第二視頻的操作相似度以及第一視頻和第二視頻的內容相似度,得到第一視頻和第二視頻的視頻相似度。
較佳地,所述確定操作相似度模塊還用于:
針對一個集合,根據所述集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的相似度;
根據各個集合對應的第一視頻和第二視頻的相似度,得到第一視頻和第二視頻的操作相似度。
較佳地,所述確定操作相似度模塊還用于:
根據以下方式確定所述集合對應的第一視頻和第二視頻的相似度:
sim1i(j,k)=nj,kmax{nj,k|j,k∈Siandj≠k}]]>
其中,sim1i(j,k)為所述集合對應的第一視頻j和第二視頻k的相似度,Si 為所述集合對應的所有視頻集,j’、k’為任意兩部視頻,nj,k為對第一視頻j和第二視頻k都存在相同操作行為的用戶數量,nj’,k’為對任意兩部視頻j’和k’都存在相同操作行為的用戶數量。
較佳地,所述確定操作相似度模塊還用于:
根據各個集合對應的第一視頻和第二視頻的相似度,以及各個集合對應的相似度權重,確定第一視頻和第二視頻的操作相似度。
較佳地,所述確定視頻相似度模塊還用于:
根據以下方式確定所述第一視頻和第二視頻的內容相似度:
sim2(j,k)=v→j·v→k||v→j||||v→k||]]>
其中,sim2(j,k)為第一視頻和第二視頻的內容相似度,向量的屬性中包括第一視頻的內容信息,向量的屬性中包括第二視頻的內容信息。
本發明實施例通過將基于用戶的操作行為信息的視頻之間的操作相似度和基于視頻信息的視頻之間的內容相似度兩個方面結合起來確定視頻相似度,根據視頻相似度,得到某一視頻的一系列相關視頻的整體排名,向用戶推薦排名結果靠前的視頻。由于本發明實施例將視頻的操作相似度內容相似度通過線性插值的方式進行融合來確定視頻相似度,在調整參數設定值的情況下,能夠使所述方法在冷啟動階段、小型數據量階段和大數據量階段得到更廣泛地應用。
附圖說明
圖1是本發明實施例的確定視頻相似度的方法流程圖;
圖2是本發明實施例的視頻相似度融合公式的適用范圍示意圖;
圖3是本發明實施例的確定視頻相似度的裝置示意圖;
圖4是本發明實施例的另一種確定視頻相似度的裝置示意圖。
具體實施方式
本發明實施例通過獲取對視頻具有操作行為的用戶及用戶數量;根據不同 的操作行為,將所述視頻以及與所述視頻對應的用戶及用戶數量劃分不同集合;根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度;根據所述第一視頻和第二視頻的操作相似度以及第一視頻和第二視頻的內容相似度,得到第一視頻和第二視頻的視頻相似度。本發明實施例通過將視頻之間的操作相似度和內容相似度結合起來確定視頻相似度,根據視頻相似度,得到某一視頻的一系列相關視頻的整體排名,向用戶推薦排名結果靠前的視頻。
下面結合說明書附圖對本發明實施例作進一步詳細描述。
圖1為本發明實施例提供的一種確定視頻相似度的方法所對應的流程示意圖,該確定視頻相似度的方法主要包括如下步驟101至步驟103:
步驟101,獲取對視頻具有操作行為的用戶及用戶數量;
步驟102,根據不同的操作行為,將所述視頻以及與所述視頻對應的用戶及用戶數量劃分不同集合;根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度;
步驟103,根據所述第一視頻和第二視頻的操作相似度以及第一視頻和第二視頻的內容相似度,得到第一視頻和第二視頻的視頻相似度。
具體的,在本發明實施例步驟101中,可以在設定的一段時間內,獲取對視頻具有操作行為的用戶及用戶數量,并對基礎數據進行降噪處理,剔除掉非優質視頻的數據以及終端用戶沒有發生實際操作行為的數據,例如,用戶觀看視頻的時間低于設定的時間閾值。根據終端用戶的操作行為的不同,將所述視頻以及與所述視頻對應的用戶及用戶數量劃分不同集合。所述終端用戶的操作行為包括顯性行為和隱性行為,例如用戶觀看視頻的行為、用戶收藏視頻的行為、用戶瀏覽視頻詳情介紹的行為、用戶在社交網絡中關注視頻的行為等,此處不再一一列舉。
可選的,獲取對視頻具有操作行為的用戶及用戶數量后,按照用戶的顯性 行為和隱性行為,將所述視頻以及與所述視頻對應的用戶及用戶數量分為兩類,分別為顯性行為對應的類別和隱性行為對應的類別;進一步,在上述兩個類別中,根據操作行為的不同,將所述視頻以及與所述視頻對應的用戶及用戶數量劃分不同集合。
在步驟102中,所述的第一視頻和第二視頻為隨機選取的兩個視頻;在一個指定的集合中,例如用戶觀看視頻行為對應的集合中,根據對第一視頻具有觀看行為的用戶及用戶數量,以及對第二視頻具有觀看行為的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度。
在步驟103中,根據第一視頻和第二視頻的內容信息,計算第一視頻和第二視頻的內容相似度,將第一視頻和第二視頻的操作相似度和內容相似度結合起來,得到第一視頻和第二視頻的視頻相似度。
較佳地,在步驟102中,所述根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度,具體為:
針對一個集合,根據所述集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的相似度;
根據各個集合對應的第一視頻和第二視頻的相似度,得到第一視頻和第二視頻的操作相似度。
具體的,在步驟102中,根據一個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,根據下列方式確定所述集合對應的第一視頻和第二視頻的相似度:
sim1i(j,k)=nj,kmax{nj,k|j,k∈Siandj≠k}]]>
其中,sim1i(j,k)為所述集合對應的第一視頻j和第二視頻k的相似度,Si為所述集合對應的所有視頻集,j’、k’為任意兩部視頻,nj,k為對第一視頻j和第二視頻k都存在相同操作行為的用戶數量,nj’,k’為對任意兩部視頻j’和k’都存在相同操作行為的用戶數量。
同理,可得到各個集合對應的第一視頻和第二視頻的相似度,進而得到第一視頻和第二視頻的操作相似度。
比如,在用戶觀看視頻行為對應的集合中,nj,k表示在設定的時間內,既觀看了第一視頻j又觀看了第二視頻k的用戶數量;nj’,k’表示該集合中觀看了任意兩部視頻j’和k’的用戶數量的最大值,根據上述公式即可得到具有用戶觀看視頻行為的操作信息這一集合對應的第一視頻j和第二視頻k的相似度。假定nj,k=104,nj’,k’=2*104,此時有sim11(j,k)=0.5。
較佳地,在步驟102中,根據各個集合對應的第一視頻和第二視頻的相似度,以及各個集合對應的相似度權重,確定第一視頻和第二視頻的操作相似度。
具體的,分別采用上述方法計算出各個集合對應的第一視頻和第二視頻的相似度,并對各個集合對應的第一視頻和第二視頻的相似度設定權重值,權重值可以設定為0~1中的任意值,這樣可使得到的操作相似度的值在[0,1]范圍內,與后面的內容相似度的值處于同一個區間上。根據所設定的權重值,將各個集合對應的第一視頻和第二視頻的相似度加權相加,進而可確定第一視頻和第二視頻的操作相似度。
比如,在用戶觀看視頻行為的集合中,第一視頻j和第二視頻k的相似度sim11(j,k)=0.5,設定該集合對應的權重值為0.5;在用戶收藏視頻行為的集合中,第一視頻j和第二視頻k的相似度sim12(j,k)=0.6,設定該集合對應的權重值為0.3;在用戶瀏覽視頻詳情介紹行為的集合中,第一視頻j和第二視頻k的相似度sim13(j,k)=0.2,設定該集合對應的權重值為0.1;在用戶在社區網絡中關注視頻行為的集合中,第一視頻j和第二視頻k的相似度sim14(j,k)=0.5,設定該集合對應的權重值為0.1;此時,第一視頻和第二視頻的操作相似度sim1(j,k)=0.5*0.5+0.6*0.3+0.2*0.1+0.5*0.1=0.5。
較佳地,在步驟103中,通過余弦相似度的方式,得到第一視頻和第二視頻的內容相似度;將第一視頻和第二視頻的操作相似度以及第一視頻和第二視頻的內容相似度通過線性插值的方式進行計算,得到第一視頻和第二視頻的視 頻相似度。
具體的,使用向量分別代表第一視頻j和第二視頻k,向量的屬性中可以包含諸如演員信息、導演信息、視頻類型等,例如第一視頻j的演員為周星馳、導演為周星馳、視頻類型為喜劇,在對大量視頻的信息進行整體分析的基礎上,對這些信息進行定量化處理,假設可設定以同樣的方式,假設可設定向量進而采用余弦相似度計算兩個視頻的內容相似度sim2(j,k),其計算公式如下
sim2(j,k)=v→j·v→k||v→j||||v→k||]]>
計算可得sim2(j,k)=5+6+21+9+425+4+1=0.634]]>
將第一視頻j和第二視頻k的操作相似度sim1(j,k)以及第一視頻j和第二視頻k的內容相似度sim2(j,k)采用線性插值的方式,通過以下公式得到第一視頻j和第二視頻k的視頻相似度sim(j,k):
sim(j,k)=α·sim1(j,k)+(1-α)·sim2(j,k)
其中,α用于平衡第一視頻j和第二視頻k的操作相似度sim1(j,k)以及第一視頻j和第二視頻k的內容相似度sim2(j,k)對于第一視頻j和第二視頻k的視頻相似度sim(j,k)的影響。
比如,假設參數α=0.2,根據上述得到的第一視頻j和第二視頻k的操作相似度sim1(j,k)以及第一視頻j和第二視頻k的內容相似度sim2(j,k),可得視頻相似度sim(j,k)=0.2*0.5+(1-0.2)*0.634=0.607。
基于上述公式,可以得到任意兩個視頻的視頻相似度。對于每部視頻,記錄與其視頻相似度的值按大小順序排名前k個視頻,然后在用戶瀏覽該視頻時向用戶推薦所記錄的最相關的前k個視頻。
圖2為本發明實施例的視頻相似度融合公式的適用范圍示意圖,調整參數α的設定值可使該方法更廣泛的適用于推薦系統的生命周期,在推薦系統初期用戶對視頻的操作信息較少的情況下,用戶對哪一種視頻進行操作行為存在著 很大的隨機性,根據操作信息得到的操作相似度無法反映出視頻之間的視頻相似度,因此可忽略視頻的操作相似度,僅根據視頻內容相似度來確定視頻之間的視頻相似度,采用冷啟動的預案處理視頻的相關推薦,此時α無限接近于0;對于存在新加入視頻的情況下,用戶對新加入視頻的操作信息較少,根據操作信息得到的新加入的視頻與其他視頻之間的操作相似度無法反映出新加入的視頻與其他視頻之間的視頻相似度,因此可忽略視頻的操作相似度,僅根據視頻內容相似度來確定視頻之間的視頻相似度,采用冷啟動的預案處理視頻的相關推薦,此時α無限接近于0。
在積累一定數量的用戶對視頻的操作信息后,用戶對哪一種視頻進行操作行為具有了一定的統計規律,此時根據操作信息得到的操作相似度能夠在一定程度上反映出視頻之間的視頻相似度,因此此時以視頻的內容相似度為主,操作相似度為輔,采用小型數據量的預案調整方法處理視頻的相關推薦,使其相關視頻推薦的結果集呈現少量多樣性的數據,此時α的取值在(0,0.5]范圍內。
在用戶對視頻的操作信息滿足基于協同過濾行為分析算法所需的基礎數據量之后,用戶對哪一種視頻進行操作行為具有很強的規律性,根據操作信息得到的操作相似度能夠準確地反映出視頻之間的視頻相似度,因此此時以視頻的操作相似度為主,內容相似度為輔,進行多樣性的相關視頻推薦,此時α的取值在(0.5,1]范圍內。
針對上述方法流程,本發明實施例還提供一種確定視頻相似度的裝置,該裝置的具體內容可以參照上述方法實施,在此不再贅述。
本發明實施例提供的一種確定視頻相似度的裝置,參見圖3所示。本發明實施例確定視頻相似度的裝置包括:
獲取信息模塊301,用于獲取對視頻具有操作行為的用戶及用戶數量;
確定操作相似度模塊302,用于根據不同的操作行為,將所述視頻以及與所述視頻對應的用戶及用戶數量劃分不同集合;根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和 第二視頻的操作相似度;
確定視頻相似度模塊303,用于根據所述第一視頻和第二視頻的操作相似度以及第一視頻和第二視頻的內容相似度,得到第一視頻和第二視頻的視頻相似度。
所述確定操作相似度模塊302還用于,針對一個集合,根據所述集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的相似度;根據各個集合對應的第一視頻和第二視頻的相似度,得到第一視頻和第二視頻的操作相似度。
所述確定操作相似度模塊302還用于,根據以下方式確定所述集合對應的第一視頻和第二視頻的相似度:
sim1i(j,k)=nj,kmax{nj,k|j,k∈Siandj≠k}]]>
其中,sim1i(j,k)為所述集合對應的第一視頻j和第二視頻k的相似度,Si為所述集合對應的所有視頻集,j’、k’為任意兩部視頻,nj,k為對第一視頻j和第二視頻k都存在相同操作行為的用戶數量,nj’,k’為對任意兩部視頻j’和k’都存在相同操作行為的用戶數量。
所述確定視頻相似度模塊303還用于,根據各個集合對應的第一視頻和第二視頻的相似度,以及各個集合對應的相似度權重,確定第一視頻和第二視頻的操作相似度;以及,根據以下方式確定所述第一視頻和第二視頻的內容相似度:
sim2(j,k)=v→j·v→k||v→j||||v→k||]]>
其中,sim2(j,k)為第一視頻和第二視頻的內容相似度,向量的屬性中包括第一視頻的內容信息,向量的屬性中包括第二視頻的內容信息。
本發明實施例提供的另一種確定視頻相似度的裝置,參見圖4所示。本發明實施例的另一種確定視頻相似度的裝置包括:
收集器401,用于獲取對視頻具有操作行為的用戶及用戶數量;
處理器403,用于根據不同的操作行為,將所述視頻以及與所述視頻對應的用戶及用戶數量劃分不同集合;根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度;根據所述第一視頻和第二視頻的操作相似度以及第一視頻和第二視頻的內容相似度,得到第一視頻和第二視頻的視頻相似度。
所述處理器403還用于,針對一個集合,根據所述集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的相似度;根據各個集合對應的第一視頻和第二視頻的相似度,得到第一視頻和第二視頻的操作相似度。
所述處理器403還用于,根據以下方式確定所述集合對應的第一視頻和第二視頻的相似度:
sim1i(j,k)=nj,kmax{nj,k|j,k∈Siandj≠k}]]>
其中,sim1i(j,k)為所述集合對應的第一視頻j和第二視頻k的相似度,Si為所述集合對應的所有視頻集,j’、k’為任意兩部視頻,nj,k為對第一視頻j和第二視頻k都存在相同操作行為的用戶數量,nj’,k’為對任意兩部視頻j’和k’都存在相同操作行為的用戶數量。
所述處理器403還用于,根據各個集合對應的第一視頻和第二視頻的相似度,以及各個集合對應的相似度權重,確定第一視頻和第二視頻的操作相似度;以及,根據以下方式確定所述第一視頻和第二視頻的內容相似度:
sim2(j,k)=v→j·v→k||v→j||||v→k||]]>
其中,sim2(j,k)為第一視頻和第二視頻的內容相似度,向量的屬性中包括第一視頻的內容信息,向量的屬性中包括第二視頻的內容信息。
其中,在圖4中,總線架構可以包括任意數量的互聯的總線和橋,具體由處理器403代表的一個或多個處理器和存儲器402代表的存儲器的各種電路鏈接在一起??偩€架構還可以將諸如外圍設備、穩壓器和功率管理電路等之類的 各種其他電路鏈接在一起,這些都是本領域所公知的,因此,本文不再對其進行進一步描述??偩€接口提供接口,收集器401可以是多個元件,處理器403負責管理總線架構和通常的處理,存儲器402可以存儲處理器403在執行操作時所使用的數據。
從上述內容可以看出:
本發明實施例通過獲取對視頻具有操作行為的用戶及用戶數量;根據不同的操作行為,將所述視頻以及與所述視頻對應的用戶及用戶數量劃分不同集合;根據各個集合中與第一視頻對應的用戶及用戶數量以及與第二視頻對應的用戶及用戶數量,得到第一視頻和第二視頻的操作相似度;根據所述第一視頻和第二視頻的操作相似度以及第一視頻和第二視頻的內容相似度,得到第一視頻和第二視頻的視頻相似度。本發明實施例通過將視頻之間的操作相似度和內容相似度結合起來確定視頻相似度,根據視頻相似度,得到某一視頻的一系列相關視頻的整體排名,向用戶推薦排名結果靠前的視頻。
本領域內的技術人員應明白,本發明的實施例可提供為方法、系統、或計算機程序產品。因此,本發明可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本發明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器、CD-ROM、光學存儲器等)上實施的計算機程序產品的形式。
本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設 備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
盡管已描述了本發明的優選實施例,但本領域內的技術人員一旦得知了基本創造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權利要求意欲解釋為包括優選實施例以及落入本發明范圍的所有變更和修改。
顯然,本領域的技術人員可以對本發明進行各種改動和變型而不脫離本發明的精神和范圍。這樣,倘若本發明的這些修改和變型屬于本發明權利要求及其等同技術的范圍之內,則本發明也意圖包含這些改動和變型在內?!  热輥碜詫@Wwww.6726714.live轉載請標明出處

關于本文
本文標題:一種確定視頻相似度的方法及裝置.pdf
鏈接地址:http://www.6726714.live/p-277701.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
广州跑腿兼职赚钱软件