Bài báo: “MAT: Effective Link Prediction via Mutual Attention Transformer”
Sinh viên thực hiện:
- Nguyễn Văn Quân – 21521333 – Khoa học dữ liệu – Tác giả chính.
- Phạm Quang Huy – 21522163 – Khoa học dữ liệu – Đồng tác giả.
- Trần Quang Dân – 21521917 – Khoa học dữ liệu – Đồng tác giả.
- Nguyễn Kiến Bảo Thắng – 21521432 – Khoa học dữ liệu - Đồng tác giả.
Giảng viên hướng dẫn: Thầy Nguyễn Hiếu Nghĩa.
Tóm tắt bài báo:
DSAA (Khoa học dữ liệu và phân tích nâng cao) 2023 là một phần của hội nghị DSAA 2023. Thử thách này nhằm mục đích khám phá những cách tiếp cận hiệu quả có thể cho biết liệu có tồn tại một liên kết giữa hai trang Wikipedia hay không. Cụ thể, với một cặp node (u,v) cùng với thông tin về mỗi node, mục tiêu chính là xác định xem có liên kết nào giữa hai node hay không, trong đó nhãn 1 biểu thị "có" và nhãn 0 biểu thị "không". Quyết định cuối cùng sẽ dựa trên tính hiệu quả của phương pháp (điểm số), hiệu suất (thời gian cần thiết cho quá trình đào tạo và kiểm tra) và tính mới của phương pháp được đề xuất.
Bằng cách dự đoán thành công sự có xuất hiện hay không của một liên kết, chúng tôi góp phần khám phá các kết nối và mối quan hệ cơ bản có sẵn trong mạng Wikipedia. Kết quả của nhiệm vụ này rất cần thiết cho các ứng dụng khác nhau như tái thiết mạng, đề xuất và tìm hiểu sự phát triển của mạng.
Trong bài báo này, chúng tôi trình bày phương pháp Vanilla Fully Connected (VFC) và phương pháp Mutual Attention Transformer (MAT). Phương pháp VFC chỉ sử dụng thông tin id. Ngược lại, phương pháp MAT có thể sử dụng thông tin id và văn bản của cả hai node. Dựa trên kết quả của cuộc thi, chúng tôi có thể tự tin khẳng định VFC và MAT có hiệu quả trong việc giải quyết nhiệm vụ được đề ra trong DSAA Challenge 2023.
Hội nghị quốc tế về khoa học dữ liệu và phân tích nâng cao của IEEE (IEEE DSAA) là diễn đàn khoa học dữ liệu hàng đầu được IEEE, ACM, ASA và CCF đồng hỗ trợ. DSAA được công nhận bởi bảng xếp hạng hội nghị CORE và CCF, top 20 về khai thác và phân tích dữ liệu trong Google Metrics. DSAA giữ vị trí cao với các ghế chủ trì chương trình/chung cấp cao, các diễn giả chính xuất sắc, sự tham gia đa ngành và liên miền về thống kê, tin học, điện toán, công nghiệp và chính phủ cũng như Giải thưởng Nhà khoa học Dữ liệu Thế hệ Tiếp theo.
Thông tin chi tiết:
Hải Băng - Cộng tác viên Truyền thông trường bet365 betting