Đề 13 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Đề 13 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Đề 13 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Số câu30
Quiz ID13238
Câu 1
1. Khi đánh giá mô hình phân cụm, độ đo 'Silhouette score' được sử dụng để đánh giá điều gì?
Câu 2
2. Trong quy trình khai phá dữ liệu, giai đoạn nào tập trung vào việc làm sạch dữ liệu, xử lý dữ liệu bị thiếu và chuyển đổi dữ liệu sang định dạng phù hợp?
Câu 3
3. Kỹ thuật 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong quá trình xây dựng mô hình khai phá dữ liệu?
Câu 4
4. Thuật toán Apriori được sử dụng chủ yếu trong lĩnh vực nào của khai phá dữ liệu?
Câu 5
5. Phương pháp khai phá dữ liệu nào được sử dụng để phân nhóm dữ liệu thành các cụm dựa trên sự tương đồng giữa các đối tượng, mà không có nhãn lớp định trước?
Câu 6
6. Trong thuật toán K-Means, giá trị 'K' đại diện cho điều gì?
Câu 7
7. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của khai phá dữ liệu?
Câu 8
8. Khi nào thì việc sử dụng một mô hình khai phá dữ liệu phức tạp (ví dụ: mạng nơ-ron sâu) trở nên cần thiết hơn so với mô hình đơn giản (ví dụ: cây quyết định)?
Câu 9
9. Trong quá trình khai phá dữ liệu, vấn đề 'data drift' (trôi dữ liệu) đề cập đến hiện tượng gì?
Câu 10
10. Phương pháp 'ensemble learning' (học tập kết hợp) trong khai phá dữ liệu hoạt động như thế nào?
Câu 11
11. Sự khác biệt chính giữa học có giám sát (supervised learning) và học không giám sát (unsupervised learning) trong khai phá dữ liệu là gì?
Câu 12
12. Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu (dimensionality reduction)?
Câu 13
13. Khai phá dữ liệu (Data Mining) được định nghĩa chính xác nhất là:
Câu 14
14. Một trong những thách thức lớn nhất trong khai phá dữ liệu từ dữ liệu lớn (Big Data) là gì?
Câu 15
15. Trong khai phá dữ liệu, 'outlier detection' (phát hiện ngoại lai) có ứng dụng quan trọng trong lĩnh vực nào sau đây?
Câu 16
16. Trong ngữ cảnh đánh giá mô hình phân lớp, 'confusion matrix' (ma trận nhầm lẫn) cung cấp thông tin gì?
Câu 17
17. Thuật toán nào sau đây KHÔNG thuộc nhóm thuật toán phân lớp (Classification)?
Câu 18
18. Kỹ thuật 'feature selection' (lựa chọn thuộc tính) trong tiền xử lý dữ liệu nhằm mục đích gì?
Câu 19
19. Kỹ thuật 'data augmentation' (tăng cường dữ liệu) thường được sử dụng để làm gì trong khai phá dữ liệu, đặc biệt là trong học sâu (deep learning)?
Câu 20
20. Trong khai phá dữ liệu, 'overfitting' (quá khớp) xảy ra khi nào?
Câu 21
21. Độ đo nào sau đây thường được sử dụng để đánh giá hiệu suất của mô hình phân lớp?
Câu 22
22. Yếu tố nào sau đây KHÔNG phải là một trong '5 Vs' thường được dùng để mô tả đặc điểm của Big Data?
Câu 23
23. Trong khai phá luật kết hợp (association rule mining), độ đo 'support' (độ hỗ trợ) của một luật {A} -> {B} được tính như thế nào?
Câu 24
24. Khai phá dữ liệu có thể hỗ trợ quá trình ra quyết định trong kinh doanh như thế nào?
Câu 25
25. Độ đo 'confidence' (độ tin cậy) của một luật kết hợp {A} -> {B} được tính như thế nào?
Câu 26
26. Trong khai phá dữ liệu không gian (spatial data mining), loại dữ liệu nào được phân tích chủ yếu?
Câu 27
27. Trong khai phá dữ liệu chuỗi thời gian (time series data mining), phương pháp nào thường được sử dụng để dự báo giá trị tương lai dựa trên các giá trị quá khứ?
Câu 28
28. Trong khai phá dữ liệu web (web mining), 'web usage mining' (khai phá sử dụng web) tập trung vào việc phân tích dữ liệu nào?
Câu 29
29. Trong khai phá dữ liệu văn bản (text mining), kỹ thuật 'TF-IDF' được sử dụng để làm gì?
Câu 30
30. Vấn đề 'curse of dimensionality' (lời nguyền chiều dữ liệu) trong khai phá dữ liệu đề cập đến điều gì?

Để lại một bình luận