Chúc mừng nhóm sinh viên Khoa học Máy tính có bài báo khoa học được chấp nhận đăng tại Hội nghị khoa học MAPR 2024

T4, 12/06/2024 - 17:48

7th International Conference on Multimedia Analysis and Pattern Recognition (MAPR), được tài trợ bởi VAPR (Vietnamese Association on Pattern Recognition), sẽ diễn ra tại Đà Nẵng, Việt Nam, vào ngày 15-16 tháng 8 năm 2024. Mục tiêu của hội nghị này là tạo cơ hội cho các nhà nghiên cứu và chuyên gia từ cả học viện và ngành công nghiệp để chia sẻ những kết quả nghiên cứu mới nhất và củng cố cơ hội hợp tác trong lĩnh vực nhận dạng mẫu, phân tích đa phương tiện và các lĩnh vực liên quan. Một số chủ đề mà hội nghị quan tâm đến là: Pattern Recognition and Machine Learning, Multimedia Analysis, Biomedical Image Analysis and Biometrics, Computer Vision and Robot Vision, Document Analysis and Recognition, Applications.

Bài báo: “VISA: Video Interactive Search with Advanced Visual Programming”

Sinh viên thực hiện:

- Lưu Đức Tuấn - Nghiên cứu viên PTN TTĐPT (MMLAB) - Tác giả chính

- Nguyễn Duy Ngọc - KHCL 2021 - Đồng tác giả

- Bùi Lê Khánh Linh - KHCL 2021 - Đồng tác giả

Giáo viên hướng dẫn:

- TS. Nguyễn Vinh Tiệp

- PGS.TS. Trần Minh Triết

Tóm tắt bài báo:

Video retrieval has become an important task in computer vision, with video contents uploaded to the Internet every hour. Along with retrieving the relevant visual content, users may also want to perform several post-processing steps such as visual editing, understanding or video summarizing. However, to our knowledge, there is no such integrated system that enables users to perform downstream visual understanding and editing tasks via text prompts. In this work, we propose VISA framework, which combines a visual programming module with a video search system. Specifically, our interactive framework offers fundamental video retrieval with semantic search, text search and audio search with descriptive inputs summarized by a large language model (LLM). After obtaining the video frame results, users can provide natural language instructions as guidance for image understanding and editing tasks. Having the in-context learning capability of LLMs, our visual programming module generates high-level and interpretable pseudocodes from the given instructions. The corresponding Python programs are then executed to achieve the desired results. We evaluate our VISA framework on the 2023 Ho Chi Minh City AI Challenge dataset and the image editing component on the MagicBrush benchmark.

“Chúng tôi xin chân thành cảm ơn Phòng thí nghiệm Truyền thông Đa phương tiện (MMLab), Khoa Khoa học máy tính đã hỗ trợ, tạo điều kiện cho chúng tôi trong quá trình nghiên cứu này”.

Mọi thông tin chi tiết xem tại:

Đông Xanh - Cộng tác viên truyền thông Trường bet365 betting

Bài viết nổi bật

11.2024

05

Sinh viên UIT chinh phục cơ hội du học ngắn hạn tại Đảo quốc Sư... UIT

Đôi khi, cơ hội lớn bắt đầu từ những khoảnh khắc rất giản dị. Một lần tình cờ thấy bài đăng trên diễn đàn, một quyết...

11.2024

05

Tổng kết chương trình Unitour 2024 - “Bắt nhịp xu hướng, dẫn đầu... UIT

Sáng ngày 30/10, chương trình Unitour 2024 tại Trường bet365 betting , ĐHQG-HCM đã thu hút hơn 250 sinh...

11.2024

04

Lễ Công bố và trao quyết định bổ nhiệm công tác nhân sự lãnh đạo... UIT

Sáng 4/11/2024, Trường bet365 betting , ĐHQG-HCM đã tổ chức Lễ công bố các quyết định bổ nhiệm nhân sự đối...

10.2024

31

Cựu sinh viên UIT từ Bosch truyền lửa cho UITers tại Digital....

Chương trình Digital.auto Bootcamp 2024 với sự kết hợp giữa Trường bet365 betting và Bosch Global Software...

10.2024

29

UIT ký tuyên bố chung về hợp tác đào tạo và phát triển nguồn...

UIT KÝ TUYÊN BỐ CHUNG VỀ HỢP TÁC ĐÀO TẠO VÀ PHÁT TRIỂN NGUỒN NHÂN LỰC CHẤT BÁN DẪN VIỆT NAM - NHẬT BẢN Sáng nay, UIT...

Trường bet365 betting

SỨ MẠNG

- Trường bet365 betting là một trung tâm đào tạo đại học, sau đại học cung cấp nguồn nhân lực chất lượng cao, nhằm đáp ứng nhu cầu của thị trường lao động và phục vụ cộng đồng.

- Trường bet365 betting là một trung tâm hàng đầu về nghiên cứu khoa học và chuyển giao công nghệ về công nghệ thông tin – truyền thông và các lĩnh vực liên quan.

TẦM NHÌN

Trường bet365 betting trở thành trường đại học uy tín về công nghệ thông tin – truyền thông và các lĩnh vực liên quan trong khu vực Châu Á.

Liên kết nhanh

Liên hệ

ĐỊA CHỈKhu phố 6, P.Linh Trung, Tp.Thủ Đức, Tp.Hồ Chí Minh.
ĐIỆN THOẠI(028) 372 52002
FAX(028) 372 52148
EMAIL[email protected]

bet365 betting Nền tảng chính thức

Đăng nhập

Bạn đang ở đây

Chúc mừng nhóm sinh viên Khoa học Máy tính có bài báo khoa học được chấp nhận đăng tại Hội nghị khoa học MAPR 2024

Bài viết liên quan

Trang

Bài viết nổi bật