Đề 3 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Đề 3 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Đề 3 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

Số câu30
Quiz ID13228
Câu 1
1. Ma trận nhầm lẫn (confusion matrix) được sử dụng để đánh giá hiệu suất của mô hình nào?
Câu 2
2. Khi dữ liệu bị 'quá khớp' (overfitting) trong mô hình học máy, điều gì có khả năng xảy ra?
Câu 3
3. Kỹ thuật 'lựa chọn đặc trưng' (feature selection) nhằm mục đích:
Câu 4
4. Khi nào thì nên sử dụng phương pháp phân cụm phân cấp (hierarchical clustering) thay vì k-means?
Câu 5
5. Độ đo 'độ chính xác' (accuracy) trong phân lớp được tính bằng:
Câu 6
6. Khai phá dữ liệu (Data Mining) được định nghĩa chính xác nhất là:
Câu 7
7. Khi dữ liệu có thuộc tính 'mật độ thấp' (sparsity), điều này có nghĩa là:
Câu 8
8. Phương pháp 'cross-validation' (kiểm định chéo) được sử dụng để:
Câu 9
9. Ứng dụng nào sau đây KHÔNG phải là ứng dụng điển hình của khai phá dữ liệu?
Câu 10
10. Phương pháp nào sau đây giúp phát hiện các mặt hàng thường được mua cùng nhau trong siêu thị?
Câu 11
11. Khi đánh giá mô hình phân cụm, độ đo 'silhouette score' cao cho thấy:
Câu 12
12. Mục tiêu chính của việc tiền xử lý dữ liệu trong khai phá dữ liệu là:
Câu 13
13. Trong khai phá dữ liệu chuỗi thời gian (time series data mining), mục tiêu có thể là:
Câu 14
14. Trong khai phá dữ liệu, 'dữ liệu nhiễu' (noisy data) đề cập đến:
Câu 15
15. Mô hình Naive Bayes dựa trên giả định nào?
Câu 16
16. Kỹ thuật nào sau đây thường được sử dụng để dự đoán giá nhà dựa trên các đặc điểm như diện tích, vị trí và số phòng ngủ?
Câu 17
17. Phương pháp nào sau đây có thể giúp xử lý dữ liệu bị thiếu giá trị (missing values)?
Câu 18
18. Trong khai phá dữ liệu không gian (spatial data mining), loại dữ liệu đặc biệt cần xử lý là:
Câu 19
19. Trong thuật toán k-means, 'k' đại diện cho:
Câu 20
20. Phương pháp giảm chiều dữ liệu (dimensionality reduction) KHÔNG bao gồm:
Câu 21
21. Trong ngữ cảnh khai phá dữ liệu lớn (big data), thách thức chính KHÔNG bao gồm:
Câu 22
22. Kỹ thuật 'chuẩn hóa dữ liệu' (data normalization) thường được áp dụng trước khi sử dụng thuật toán nào?
Câu 23
23. Trong khai phá dữ liệu văn bản (text mining), kỹ thuật 'TF-IDF' được sử dụng để:
Câu 24
24. Bước nào sau đây KHÔNG thuộc quy trình Khám phá tri thức từ dữ liệu (KDD)?
Câu 25
25. Kỹ thuật 'bootstrap aggregating' (bagging) trong học máy nhằm mục đích:
Câu 26
26. Trong khai phá dữ liệu, kỹ thuật phân cụm (clustering) được sử dụng để:
Câu 27
27. Thuật toán Apriori được sử dụng chủ yếu trong kỹ thuật khai phá dữ liệu nào?
Câu 28
28. Ưu điểm chính của cây quyết định (decision tree) so với các mô hình phân lớp khác là:
Câu 29
29. Mục đích của việc chia dữ liệu thành tập huấn luyện, tập kiểm tra và tập xác thực (validation set) là gì?
Câu 30
30. Độ đo 'độ thu hồi' (recall) trong phân lớp được định nghĩa là:

Để lại một bình luận