ネットワークグラフを用いたSNSにおける個人の影響力

f:id:meetaps:20190830194913j:plain

スマートフォンやインターネットの普及、関連技術の発展とともに、メルカリ、Airbnb、Instagramなどを通じて、自分の資産(モノ、場所、体験など)をシェアできるサービスが浸透しています。そこでは、個人が個人に影響を与え、評価されます。その結果は、インターネット(ネットワーク)を通じて共有され、評価の高い人の周りに人が集まります。

スマートフォンやインターネットの普及、関連技術の発展とともに、メルカリ、Airbnb、Instagramなどを通じて、自分の資産(モノ、場所、体験など)をシェアできるサービスが浸透しています。そこでは、個人が個人に影響を与え、評価されます。その結果は、インターネット(ネットワーク)を通じて共有され、評価の高い人の周りに人が集まります。そして、次第に彼らを中心としたコミュニティが形成され、評価の高い人の影響力が強まり、それを活用したビジネスが生まれてきています。例えば、eMarketerによると、2016年のインスタグラムのインフルエンサーには約640億円のマーケティング費用が投下されたそうです。そこで、本記事では、Twitterを題材に、個々の影響力をどのように測定するのか、その方法論について議論します。まずは、土台となる「ネットワーク」の特徴について見ていきましょう。

図1: Twitterのメンションネットワーク

ネットワークの特徴 1つめの大きな特徴としては「スケールフリー(冪乗則)」があります。スケールフリーとは、ごく一部の人が大勢からフォローされていて、そのユーザ数は、P(x) ∝ x-kのように、冪乗で表現されます(図2.参照)。これは、収入の分布、都市の人口分布、映画の興行収入の分布、はやぶさが地面と衝突した時にできた破片の大きさの分布などとも同じ構造をしています。TwitterやFacebookに特有の話ではなく、社会現象や自然現象にもスケールフリー性が出てくるのは、世の中を理解するという観点でとても興味深いです。

図2. スケールフリー

 2つめの特徴は「スモールワールド」です。スモールワールドとは、世間は意外に狭く、友達をたどれば、SNSでは、だいたい4、5人でだいたい繋がる事象のことです。ここで重要なのは、クラスタを繋ぐハブとなる存在です。興味深いのは、このハブとなる人は、必ずしもフォロワー数が多い人でもないということです。このようにフォロワー数が多くないが、クラスタを結びつけるような人(例えば、お笑い芸人と女優を繋ぐのはTVプロデューサーだったりします)をどのように発見するのか、も議論のポイントになります。では、具体的に、「影響力」の測定について考えていきましょう。

図3. ハブの存在

フォロワー数は影響力なのか?

Twitterにおいて、フォロワー数は、影響力を測るための重要な指標なのでしょうか。もちろん、1つの指標にはなりますが、フォロワー数だけでは、ユーザの影響度を適切に判断することはできません。図4. をみてください。左図はフォロワー数と1投稿あたりにいいねされた数と標準偏差)を表しています。同じフォロワー数でも、いいねの数には、数十%程の大きなバラツキがあります。これは、フォロワー数と、エンゲージメント数に隔たりがあることを意味しています。つまり、表示上のフォロワー数と影響力を及ぼすことができるフォロワー数の間に大きなギャップが存在するユーザもいるため、フォロワー数だけで影響力を測ることは、適切でないことがわかります。ツイートの質が低いことも考えられますが、その場合は、すでに影響力がない、またはフォロワーの関心が離れていると考えられるため、やはり、フォロワー数だけでは適切でありません。では、どのように考えるのでしょうか。

図4. フォロワー数といいね数の関係、リツイート数といいね数の関係

ユーザ間のフォロー関係に着目

PageRankの発想をもとに、評価の高い人からたくさんフォローされる人は評価できるという考え方をしてみましょう。図5. をみてください。ユーザiの評価qiを、ユーザiをフォローしているユーザの評価の集合として考えます。ajは、フォロワーjの質を表すもので、botなど有益でない場合やユーザ間の関係が非常に薄いと予測された場合、減点します。つまり、フォロワーjには、影響を与えることができない。ωijは、jiに対する依存度(注目度)を表します。通常は、jがフォローしている数(Nj)に均等に配分しますが、jiへの依存度が高いと判断できる場合に修正ij)します。

図5.. PageRankの考えを利用した評価

 γijは、「iのツイートをjリツイートするまでの時間」、「jがある期間中にいいねやリツイートした数のうちのiに対する割合」、「相互メンション」などの組み合わせによって変化させます。もちろん、リツイートまでの時間が短く、リツイート回数が多いだけで、良い(影響を受けやすい、与えやすい)関係のユーザとはいえません。自己紹介、フォロー関係、ツイート、リツイート、いいねなどのユーザ行動から、botなど有益でない(影響を与える関係でない)確率が高いと推測できるユーザについては、ajの値を小さくすることで、測定への影響を調整します。

図6. ユーザ間の重み

まとめ

 本記事では、ネットワークグラフをもとに、個人の影響力の評価の考え方について議論しました。ポイントとしては、次のとおりです。 ・フォロワー数だけでは影響力を測ることができない ・ユーザ間のフォロー関係をもとに考える botなど影響を与える関係にないユーザは考慮しない

タイムバンクにおいても、このような考え方に基づき、オンライン上における個人の影響力スコアを測定しています。

最後に、本記事では、扱いませんでしたが、ネットワークの活用として、

・集合知(Collective Intelligence、専門家の意見よりみんなの意見)を利用した経済予測 ・ダンバー数(人が安的的に関係を築くことができる人数、150人と言われている。ただし、弱い繋がりも重要。)を意識した人間関係の最適化 など、ネットワークの応用例はたくさんあります。これらについては、また、別の機会に議論したいと思います。