Twitter Recommendation Algorithm là một tập hợp các dịch vụ và công việc đảm nhận việc xây dựng và cung cấp Dòng thời trang ở trang chủ (Home Timeline). Để tìm hiểu cách giải thuật hoạt động, vui lòng xem bài viết trên engineering blog. Hình vẽ bên dưới mô tả cách các dịch vụ và công việc chính liên kết với nhau.
Đây là các thành phần chính của Recommendation Algorithm được bao gồm trong kho lưu trữ này:
| Type | Component | Description |
|---|---|---|
| Feature | SimClusters | Phát hiện community và nhúng rãi rác vào những community đó. |
| TwHIN | Nhúng knowledge graph cho User và Tweet. | |
| trust-and-safety-models | Các mô hình để phát hiện nội dung NSFW hoặc lạm dụng. | |
| real-graph | Mô hình dự đoán khả năng tương tác của người dùng Twitter với người dùng khác. | |
| tweepcred | Thuật toán PageRank để tính toán sự uy tín của người dùng Twitter. | |
| recos-injector | Bộ xử lý sự kiện trực tiếp để xây dựng các luồng đầu vào cho các dịch vụ dựa trên GraphJet | |
| graph-feature-service | Cung cấp các tính năng graph cho một cặp Người dùng trực tiếp. (ví dụ: bao nhiêu người theo dõi của Người dùng A đã thích Tweet từ Người dùng B). | |
| Candidate Source | search-index | Tìm kiếm và xếp hạng các Tweet trong mạng nội bộ. Khoảng 50% Tweet đến từ nguồn ứng cử viên này. |
| cr-mixer | Lớp điều phối để lấy các ứng cử viên Tweet Ngoài mạng từ các dịch vụ tính toán cơ bản. | |
| user-tweet-entity-graph (UTEG) | Dùng để duy trì đồ thị tương tác Người dùng với Tweet trong bộ nhớ và tìm kiếm các ứng cử viên dựa trên điều tra của đồ thị này. Được xây dựng trên khung GraphJet. Một số tính năng và nguồn ứng cử viên khác dựa trên GraphJet được đặt tại đây (src / scala / com / twitter / recos). | |
| follow-recommendation-service (FRS) | Cung cấp người dùng các gợi ý về tài khoản để theo dõi và các Tweet từ những tài khoản đó. | |
| Ranking | light-ranker | Mô hình xếp hạng nhẹ được sử dụng bởi chỉ mục tìm kiếm (Earlybird) để xếp hạng các Tweet. |
| heavy-ranker | Mạng nơ-ron để xếp hạng các ứng cử viên Tweet. Một trong những tín hiệu chính được sử dụng để lựa chọn các Tweet trên dòng thời gian sau khi thu thập ứng cử viên. | |
| Tweet mixing & filtering | home-mixer | Dịch vụ chính được sử dụng để xây dựng và phục vụ Dòng thời gian Trang chủ. Xây dựng trên product-mixer |
| visibility-filters | Chịu trách nhiệm lọc nội dung Twitter để hỗ trợ tuân thủ những quy định, cải thiện chất lượng sản phẩm, tăng sự tin tưởng của người dùng, bảo vệ doanh thu thông qua việc sử dụng bộ lọc cứng, các xử lý sản phẩm hiển thị rõ ràng và giảm xếp hạng thô. | |
| timelineranker | Dịch vụ kế thừa cung cấp các Tweet được tính điểm liên quan từ chỉ mục tìm kiếm Earlybird và dịch vụ UTEG. | |
| Software framework | navi | Mô hình học máy hiệu suất cao được viết bằng Rust. |
| product-mixer | Framework để build nội dung của feeds (bản tin) | |
| twml | Machine learning framework được kế thừa và xây dựng trên TensorFlow v1 |
Chúng tôi bao gồm các tệp BUILD Bazel cho hầu hết các components, nhưng không bao gồm tệp top level của BUILD hoặc WORKSPACE.
