Đề 5 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Đề 5 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Đề 5 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Số câu30
Quiz ID13230
Câu 1
1. Trong khai phá dữ liệu luồng (stream data mining), thách thức chính là:
Câu 2
2. Phương pháp 'PCA' (Principal Component Analysis) thuộc nhóm kỹ thuật:
Câu 3
3. Khái niệm 'dữ liệu nhiễu' (noisy data) trong khai phá dữ liệu thường đề cập đến:
Câu 4
4. Phương pháp khai phá dữ liệu nào thường được sử dụng để phân nhóm khách hàng dựa trên hành vi mua sắm tương tự?
Câu 5
5. Độ đo F1-score là trung bình điều hòa của:
Câu 6
6. Ưu điểm chính của thuật toán Cây quyết định (Decision Tree) là gì?
Câu 7
7. Mô hình 'hộp đen' (black box model) trong khai phá dữ liệu có đặc điểm:
Câu 8
8. Thuật toán Apriori được sử dụng phổ biến trong:
Câu 9
9. Lỗi loại I (Type I error) trong kiểm định giả thuyết thống kê tương ứng với khái niệm nào trong đánh giá mô hình phân loại?
Câu 10
10. Đâu là thách thức lớn nhất khi khai phá dữ liệu từ dữ liệu lớn (Big Data)?
Câu 11
11. Trong ngữ cảnh khai phá dữ liệu, 'overfitting' xảy ra khi:
Câu 12
12. Trong ngữ cảnh đánh giá mô hình phân loại, 'ma trận nhầm lẫn' (confusion matrix) được sử dụng để:
Câu 13
13. Thuật toán nào sau đây KHÔNG thuộc nhóm thuật toán phân loại (Classification)?
Câu 14
14. Trong khai phá luật kết hợp (Association Rule Mining), độ đo 'độ tin cậy' (confidence) của một luật {A} -> {B} được tính bằng:
Câu 15
15. Trong thuật toán K-Means, giá trị 'K' đại diện cho:
Câu 16
16. Phương pháp đánh giá mô hình khai phá dữ liệu nào chia dữ liệu thành tập huấn luyện và tập kiểm thử?
Câu 17
17. Kỹ thuật 'giảm chiều dữ liệu' (Dimensionality Reduction) nhằm mục đích:
Câu 18
18. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu thiếu (missing data)?
Câu 19
19. Trong khai phá dữ liệu không gian (spatial data mining), loại dữ liệu nào sau đây là phổ biến?
Câu 20
20. Phương pháp nào sau đây KHÔNG phải là phương pháp phân cụm?
Câu 21
21. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của khai phá dữ liệu?
Câu 22
22. Trong khai phá dữ liệu chuỗi thời gian (time series data mining), mục tiêu chính thường là:
Câu 23
23. Ứng dụng của khai phá dữ liệu trong lĩnh vực y tế KHÔNG bao gồm:
Câu 24
24. Trong khai phá dữ liệu, 'độ chính xác' (accuracy) thường được sử dụng để đánh giá hiệu quả của mô hình:
Câu 25
25. Biện pháp nào sau đây thường được sử dụng để giảm thiểu overfitting trong mô hình học máy?
Câu 26
26. Trong quy trình khai phá dữ liệu CRISP-DM, giai đoạn 'Hiểu nghiệp vụ' (Business Understanding) chủ yếu tập trung vào:
Câu 27
27. Trong khai phá dữ liệu văn bản (Text Mining), kỹ thuật 'TF-IDF' được sử dụng để:
Câu 28
28. Trong mô hình hóa dữ liệu, 'chuẩn hóa dữ liệu' (data normalization) có vai trò:
Câu 29
29. Loại hình học máy nào tập trung vào việc học từ dữ liệu KHÔNG có nhãn?
Câu 30
30. Khai phá dữ liệu (Data Mining) được định nghĩa chính xác nhất là:

Để lại một bình luận