在 Elon Musk 的最新查詢之後,Twitter 為虛假賬戶指標辯護
已發表: 2022-05-25那麼,埃隆馬斯克的 Twitter 收購進展如何?
嗯,不理想。
今天,為了回應馬斯克公開批評 Twitter 計算垃圾郵件和虛假賬戶的方法顯然是錯誤的,現任 Twitter 首席執行官 Parag Agrawal 在推特上發布了對該公司當前虛假資料檢測和刪除過程的長篇解釋。
上週,馬斯克質疑推特關於所有推特賬戶中有 5% 是假的估計是否可能是正確的,並邀請他的 9000 萬多名追隨者進行他們自己的初步實驗,看看他們發現了什麼。
為了找出答案,我的團隊將對@twitter 的 100 名追隨者進行隨機抽樣。
- 埃隆馬斯克 (@elonmusk) 2022 年 5 月 14 日
我邀請其他人重複相同的過程,看看他們發現了什麼……
當然,任何像這樣的軼事測試都有很大的缺陷,最終將證明什麼都沒有。
但與平台的許多方面一樣,馬斯克似乎正在實時了解這些過程,在 440 億美元的收購中,儘管過去以各種形式提出和評估了他的各種問題。
因此,隨著圍繞這一特定元素的討論不斷增加,阿格拉瓦爾直接回應了埃隆的批評。
首先,Agrawal 解釋說檢測機器人帳戶並不容易,普通用戶可能無法做到:
“最先進的垃圾郵件活動使用協調的人工 + 自動化的組合。 他們還破壞真實賬戶,然後用它們來推進他們的活動。 [...]嚴峻的挑戰是,許多表面上看起來是假的,實際上是真實的人。 一些實際上是最危險的垃圾郵件帳戶——對我們的用戶造成最大的傷害——表面上看起來完全合法。 我們的團隊不斷更新我們的系統和規則,以盡可能多地刪除垃圾郵件,而不會無意中暫停真實的人或在真實的人使用 Twitter 時增加不必要的摩擦:我們都不想在每次使用 Twitter 時解決驗證碼。 ”
因此,在您自己的以下列表中隨機計算您懷疑是假的帳戶是不准確的。 確實,這似乎很明顯。
另請注意,每次使用應用程序時執行 CAPTCHA 驗證過程的參考直接參考了馬斯克的另一項建議。
“每個人工審核都基於定義垃圾郵件和平台操縱的 Twitter 規則,並使用公共和私人數據(例如,IP 地址、電話號碼、地理位置、客戶端/瀏覽器簽名、帳戶在活動時的行為......)對每個帳戶的確定。 私有數據的使用對於避免對實際用戶進行錯誤分類尤為重要。 沒有個人資料照片和奇怪推文的 FirstnameBunchOfNumbers 對您來說可能看起來像是機器人或垃圾郵件,但在幕後我們經常看到多個跡象表明它是一個真實的人。”
換句話說,檢測和確定虛假配置文件和垃圾郵件有很多因素,而不僅僅是直覺,或者讓普通用戶瞇起眼睛的帳戶信息。 Twitter 擁有支持其調查的後端洞察力,而且它比簡單的眼睛測試更深入。
“每個季度,我們估計該季度報告的 mDAU 中不到 5% 是垃圾郵件帳戶。 我們的估計基於對數千個賬戶的多次人工評論(重複),這些評論是從我們算作 mDAU 的賬戶中隨機抽取的,隨著時間的推移一致。 我們每個季度都這樣做,而且我們已經這樣做了很多年。”
這很有趣,因為根據馬斯克的說法,Twitter 只為這個數字抽取了 100 個隨機賬戶。
Twitter 法律部門剛剛打電話抱怨我違反了他們的 NDA,因為我透露機器人檢查樣本大小是 100!
- 埃隆馬斯克 (@elonmusk) 2022 年 5 月 14 日
這確實發生了。
正如你所看到的,馬斯克隨後進一步聲稱 Twitter 聯繫了他,因為他違反了他在這一要素上的協議條款——所以要么是馬斯克在編造,要么是阿格拉瓦爾誇大了 Twitter 的流程。
再一次,Elon 的收購行動並非一帆風順。
總而言之,Agrawal 說,實際上,根據其最近的報告,其虛假賬戶數字不到 5%。
“根據上述方法,我們對過去四個季度的實際內部估計都遠低於 5%。 我們估計的誤差幅度使我們對每個季度的公開報表充滿信心。 不幸的是,鑑於迫切需要同時使用公共和私人信息(我們無法共享),我們不相信這種特定的估計可以在外部進行。 在外部,甚至不可能知道在任何一天哪些賬戶被計為 mDAU。 在這個高級描述之下,有很多非常重要的細節。”
馬斯克的回應?
???
- 埃隆馬斯克 (@elonmusk) 2022 年 5 月 16 日
對。 似乎這會順利進行 - 再一次,看到數十億美元交易的內部陰謀歸結為誤解,以及技術解釋與個人的個人觀點,這很有趣。
鑑於馬斯克似乎無法掌握甚至一些最基本的社交媒體指標,因此往復充其量只能引發人們對馬斯克將 Twitter 轉變為賺錢機器的能力的某種程度的擔憂。
但話又說回來,許多人也會說馬斯克是對的,Twitter 的虛假個人資料數量不可能這麼低,這既基於他們自己的個人經驗,也基於已發表的外部研究,而這些研究顯然表明並非如此。
事實上,早在 2017 年,南加州大學和印第安納大學的研究人員進行的一項聯合研究發現, Twitter 大約 15% 的用戶群是機器人而不是人,而在 2018 年,Twitter暫停或刪除了超過 7000 萬個賬戶它已經確定是假的。 那時,Twitter 每月有 3.3 億活躍用戶,這意味著大約 20% 的用戶不是真實的人。
作為對這一最新交流的回應,SparkToro 對44,058 個活躍的 Twitter 賬戶進行了新的分析,並確定 19.42% 的“符合虛假或垃圾郵件賬戶的保守定義”。
那麼,關鍵可能在於 Agrawal 解釋中確定的這個元素:
我們的估計基於對數千個賬戶的多次人工評論(重複),這些評論是隨機抽樣的,隨著時間的推移,這些評論是從我們算作 mDAU 的賬戶中隨機抽取的。 我們每個季度都這樣做,而且我們已經這樣做了很多年。
— Parag Agrawal (@paraga) 2022 年 5 月 16 日
根據 Twitter,究竟什麼是 mDAU?
“我們將可獲利的每日活躍使用量或用戶 (mDAU) 定義為在任何一天通過 Twitter.com 或能夠展示廣告的 Twitter 應用程序登錄或以其他方式進行身份驗證並訪問 Twitter 的 Twitter 用戶。”
因此,可能還有其他用戶不在此計數範圍內 - 可能他們不是每天都處於活動狀態,因此錯過了評估,或者由於系統邏輯不同,他們沒有資格看到廣告。 由於參數不同,可能會有一些技術解釋來解決這些第三方調查結果與 Twitter 自己的數據之間存在某種程度的差異。
但即便如此,總體而言,Twitter 的 5% 計數似乎是一種延伸,並且是對人們在應用程序中體驗的實際事實的扭曲。
正如馬斯克所說:
那麼廣告商如何知道他們的錢得到了什麼? 這是 Twitter 財務健康的基礎。
- 埃隆馬斯克 (@elonmusk) 2022 年 5 月 16 日
當然,這是自媒體誕生以來,每個廣告商和數字營銷界的每個企業都提出的一個基本問題,所以這並不是開闢新天地,也不會成為令人吃驚的新見解。部門。
但對於馬斯克本人來說,這似乎是一個相當新的消息。 這可能再次引發人們對他對該應用程序的大規模增長計劃的質疑。
那麼現在會發生什麼? 如果馬斯克能以某種方式證明 Agrawal 錯了,並證明 Twitter 的虛假個人資料賬戶實際上比它說的要高得多,他能否退出與 Twitter 的交易?
好吧,可能不是。
馬斯克,無論好壞,在他的 Twitter 收購提案中放棄了許多盡職調查措施,以更快地推動交易,這意味著,就目前而言,他幾乎被鎖定了,這將需要大量的時間。讓他放棄交易的法律論據。
這是可行的,至少有一些法律先例,如果馬斯克能夠明確證明 Twitter 在其常規財務報表中故意誤導美國證券交易委員會,通過其虛假資料的誤報,他可能會擺脫這些要求,論點是根據其財務狀況,該平台根本不值得人們相信。 但這似乎有點牽強,尤其是考慮到 Agrawal 的解釋。
那麼,也許馬斯克只是在推動降低他的報價,以獲得更好的交易。
目前還不是 100% 清楚馬斯克正在尋求什麼結果,但就目前而言,看起來馬斯克仍然必須完成與 Twitter 的交易,即使他和他的追隨者認為這些統計數據是錯誤的。
我們會知道 Twitter 的真實虛假個人資料數量是多少嗎? 根據 Agrawal 的解釋,這似乎也不太可能,儘管這裡的技術細節似乎很重要,在 Twitter 的用戶統計中指定什麼是計數的,什麼不是計數的。
無論哪種方式,公眾辯論都只會對 Twitter 產生負面影響,要么降低廣告商對其指標的信任,要么突出其係統長期存在的問題。
對於未來的平台所有者馬斯克來說,公開推動是一件好事嗎? 這似乎是一種有缺陷的方法,特別是考慮到他可以使用的各種其他選擇,例如私人審計、內部與 Twitter 討論、通過獨立研究人員進行驗證等。
也許這正是馬斯克計劃做事的方式,但對於應用程序的下一階段來說,這並不是一個鼓舞人心的起源故事。