Skip to content

epoxyteam/the-algorithm-vn

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Twitter Recommendation Algorithm (VN)

Twitter Recommendation Algorithm là một tập hợp các dịch vụ và công việc đảm nhận việc xây dựng và cung cấp Dòng thời trang ở trang chủ (Home Timeline). Để tìm hiểu cách giải thuật hoạt động, vui lòng xem bài viết trên engineering blog. Hình vẽ bên dưới mô tả cách các dịch vụ và công việc chính liên kết với nhau.

Đây là các thành phần chính của Recommendation Algorithm được bao gồm trong kho lưu trữ này:

Type Component Description
Feature SimClusters Phát hiện community và nhúng rãi rác vào những community đó.
TwHIN Nhúng knowledge graph cho User và Tweet.
trust-and-safety-models Các mô hình để phát hiện nội dung NSFW hoặc lạm dụng.
real-graph Mô hình dự đoán khả năng tương tác của người dùng Twitter với người dùng khác.
tweepcred Thuật toán PageRank để tính toán sự uy tín của người dùng Twitter.
recos-injector Bộ xử lý sự kiện trực tiếp để xây dựng các luồng đầu vào cho các dịch vụ dựa trên GraphJet
graph-feature-service Cung cấp các tính năng graph cho một cặp Người dùng trực tiếp. (ví dụ: bao nhiêu người theo dõi của Người dùng A đã thích Tweet từ Người dùng B).
Candidate Source search-index Tìm kiếm và xếp hạng các Tweet trong mạng nội bộ. Khoảng 50% Tweet đến từ nguồn ứng cử viên này.
cr-mixer Lớp điều phối để lấy các ứng cử viên Tweet Ngoài mạng từ các dịch vụ tính toán cơ bản.
user-tweet-entity-graph (UTEG) Dùng để duy trì đồ thị tương tác Người dùng với Tweet trong bộ nhớ và tìm kiếm các ứng cử viên dựa trên điều tra của đồ thị này. Được xây dựng trên khung GraphJet. Một số tính năng và nguồn ứng cử viên khác dựa trên GraphJet được đặt tại đây (src / scala / com / twitter / recos).
follow-recommendation-service (FRS) Cung cấp người dùng các gợi ý về tài khoản để theo dõi và các Tweet từ những tài khoản đó.
Ranking light-ranker Mô hình xếp hạng nhẹ được sử dụng bởi chỉ mục tìm kiếm (Earlybird) để xếp hạng các Tweet.
heavy-ranker Mạng nơ-ron để xếp hạng các ứng cử viên Tweet. Một trong những tín hiệu chính được sử dụng để lựa chọn các Tweet trên dòng thời gian sau khi thu thập ứng cử viên.
Tweet mixing & filtering home-mixer Dịch vụ chính được sử dụng để xây dựng và phục vụ Dòng thời gian Trang chủ. Xây dựng trên product-mixer
visibility-filters Chịu trách nhiệm lọc nội dung Twitter để hỗ trợ tuân thủ những quy định, cải thiện chất lượng sản phẩm, tăng sự tin tưởng của người dùng, bảo vệ doanh thu thông qua việc sử dụng bộ lọc cứng, các xử lý sản phẩm hiển thị rõ ràng và giảm xếp hạng thô.
timelineranker Dịch vụ kế thừa cung cấp các Tweet được tính điểm liên quan từ chỉ mục tìm kiếm Earlybird và dịch vụ UTEG.
Software framework navi Mô hình học máy hiệu suất cao được viết bằng Rust.
product-mixer Framework để build nội dung của feeds (bản tin)
twml Machine learning framework được kế thừa và xây dựng trên TensorFlow v1

Chúng tôi bao gồm các tệp BUILD Bazel cho hầu hết các components, nhưng không bao gồm tệp top level của BUILD hoặc WORKSPACE.

About

Source code for Twitter's Recommendation Algorithm (VN)

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Scala 53.8%
  • Java 29.7%
  • Starlark 6.3%
  • Python 4.7%
  • C++ 2.4%
  • Rust 1.5%
  • Other 1.6%