系统集成项目管理工程师 · 2025 11月9日第4批学员回忆版

根据历史用户行为预测下单概率属于哪种数据挖掘方法?

中级 单选题 第 57 题 中等 系统集成项目管理工程师2025年下半年学员回忆版数据工程
题目

某电商公司通过分析历史用户行为数据发现:用户在晚上浏览某商品后,第二天上午完成下单的概率为15‰该公司采用的数据挖掘方法是()

A 孤立点分析
B 关联分析
C 预测分析
D 数据总结
题目类型:2025年11月9日第4批学员回忆版真题 用途:用于帮助理解系统集成项目管理工程师相关考点和答案解析,不等同于官方真题。
正确答案
C
答案解析

P251,数据挖掘的目标是发现隐藏于数据之后的规律或数据间的关系,从而服务于决策。数据挖掘常见的主要任务包括数据总结、关联分析、分类和预测、聚类分析和孤立点分析。(1)数据总结。数据总结的目的是对数据进行浓缩,给出它的总体综合描述。通过对数据的总结,将数据从较低的个体层次抽象总结到较高的总体层次上,从而实现对原始数据的总体把握。传统的、也是最简单的数据总结方法是利用统计学中的方法计算出各个数据项的和值、均值、方差、最大值、最小值等基本描述统计量,还可以利用统计图形工具,对数据制作直方图、散点图等。(2)关联分析。数据库中的数据一般都存在着关联关系,也就是说,两个或多个变量的取值之间存在某种规律性。关联分析就是找出数据库中隐藏的关联网,描述一组数据项的密切度或关系。有时并不知道数据库中数据的关联是否存在精确的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有置信度,置信度度量了关联规则的强度。(3)分类和预测。使用一个分类函数或分类模型(也常称作分类器),根据数据的属性将数据分派到不同的组中,即分析数据的各种属性,并找出数据的属性模型,确定哪些数据属于哪些组,这样就可以利用该模型来分析已有数据,并预测新数据将属于哪个组。(4)聚类分析。当要分析的数据缺乏描述信息,或者无法组织成任何分类模型时,可以采用聚类分析。聚类分析是按照某种相近程度度量方法,将数据分成一系列有意义的子集合,每一个集合中的数据性质相近,不同集合之间的数据性质相差较大。统计方法中的聚类分析是实现聚类的一种手段,它主要研宄基于几何距离的聚类。人工智能中的聚类是基于概念描述的。概念描述就是对某类对象的内源进行描述,并概括这类对象的有关特征。概念描述又分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述其同类对象之间的区别。(5)孤立点分析。数据库中的数据常常有一些异常记录,与其他记录存在着偏差。孤立点分析(或称为离群点分析)就是从数据库中检测出偏差。偏差包括很多潜在的信息,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差等。

先看结论

简短答案

根据历史用户行为预测下单概率属于哪种数据挖掘方法,正确答案是 C(预测分析)。P251,数据挖掘的目标是发现隐藏于数据之后的规律或数据间的关系,从而服务于决策。数据挖掘常见的主要任务包括数据总结、关联分析、分类和预测、聚类分析和孤立点分析。(1)数据总结。数据总结的目的是对数据进行浓缩,给出它的总体综合描述。通过对数据的总结,将数据从较低的个体层次抽象总结到较高的总体层次上,从而实现对原始数据的总体把握。传统的、也是最简单的数据总结方法是利用统计学中的方法计算出各个数据项的和值、均值、方差、最大值、最小值等基本描述统计量,还可以利用统计图形工具,对数据制作直方图、散点图等。(2)关联分析。数据库中的数据一般都存在着关联关系,也就是说,两个或多个变量的取值之间存在某种规律性。关联分析就是找出数据库中隐藏的关联网,描述一组数据项的密切度或关系。有时并不知道数据库中数据的关联是否存在精确的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有置信度,置信度度量了关联规则的强度。(3)分类和预测。使用一个分类函数或分类模型(也常称作分类器),根据数据的属性将数据分派到不同的组中,即分析数据的各种属性,并找出数据的属性模型,确定哪些数据属于哪些组,这样就可以利用该模型来分析已有数据,并预测新数据将属于哪个组。(4)聚类分析。当要分析的数据缺乏描述信息,或者无法组织成任何分类模型时,可以采用聚类分析。聚类分析是按照某种相近程度度量方法,将数据分成一系列有意义的子集合,每一个集合中的数据性质相近,不同集合之间的数据性质相差较大。统计方法中的聚类分析是实现聚类的一种手段,它主要研宄基于几何距离的聚类。人工智能中的聚类是基于概念描述的。概念描述就是对某类对象的内源进行描述,并概括这类对象的有关特征。概念描述又分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述其同类对象之间的区别。(5)孤立点分析。数据库中的数据常常有一些异常记录,与其他记录存在着偏差。孤立点分析(或称为离群点分析)就是从数据库中检测出偏差。偏差包括很多潜在的信息,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差等。

解析

易混淆概念对比表

概念本题判断区别要点记忆提示
孤立点分析 本题干扰项 与题干描述的核心场景不匹配。 看到该词不要急着选,先判断是否真正解决题干问题
关联分析 本题干扰项 与题干描述的核心场景不匹配。 看到该词不要急着选,先判断是否真正解决题干问题
预测分析 本题正确答案 P251,数据挖掘的目标是发现隐藏于数据之后的规律或数据间的关系,从而服务于决策。数据挖掘常见的主要任务包括数据总结、关联分析、分类和预测、聚类分析和孤立点分析。(1)数据总结。数据总结的目的是对数据进行浓缩,给出它的总体综合描述。通过对数据的总结,将数据从较低的个体层次抽象总结到较高的总体层次上,从而实现对原始数据的总体把握。传统的、也是最简单的数据总结方法是利用统计学中的方法计算出各个数据项的和值、均值、方差、最大值、最小值等基本描述统计量,还可以利用统计图形工具,对数据制作直方图、散点图等。(2)关联分析。数据库中的数据一般都存在着关联关系,也就是说,两个或多个变量的取值之间存在某种规律性。关联分析就是找出数据库中隐藏的关联网,描述一组数据项的密切度或关系。有时并不知道数据库中数据的关联是否存在精确的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有置信度,置信度度量了关联规则的强度。(3)分类和预测。使用一个分类函数或分类模型(也常称作分类器),根据数据的属性将数据分派到不同的组中,即分析数据的各种属性,并找出数据的属性模型,确定哪些数据属于哪些组,这样就可以利用该模型来分析已有数据,并预测新数据将属于哪个组。(4)聚类分析。当要分析的数据缺乏描述信息,或者无法组织成任何分类模型时,可以采用聚类分析。聚类分析是按照某种相近程度度量方法,将数据分成一系列有意义的子集合,每一个集合中的数据性质相近,不同集合之间的数据性质相差较大。统计方法中的聚类分析是实现聚类的一种手段,它主要研宄基于几何距离的聚类。人工智能中的聚类是基于概念描述的。概念描述就是对某类对象的内源进行描述,并概括这类对象的有关特征。概念描述又分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述其同类对象之间的区别。(5)孤立点分析。数据库中的数据常常有一些异常记录,与其他记录存在着偏差。孤立点分析(或称为离群点分析)就是从数据库中检测出偏差。偏差包括很多潜在的信息,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差等。 看到题干核心场景时优先联想到它
数据总结 本题干扰项 与题干描述的核心场景不匹配。 看到该词不要急着选,先判断是否真正解决题干问题
本题易混淆选项怎么区分
  • 孤立点分析:与题干描述的核心场景不匹配,不能作为本题最佳答案。
  • 关联分析:与题干描述的核心场景不匹配,不能作为本题最佳答案。
  • 数据总结:与题干描述的核心场景不匹配,不能作为本题最佳答案。
复习

知识点详解

数据工程是系统集成项目管理工程师考试中需要结合场景理解的考点。围绕“根据历史用户行为预测下单概率属于哪种数据挖掘方法”这类题目,复习时要先看题干描述的是概念定义、适用场景、作用效果,还是与其他选项的区别。本题的题干关键词是“某电商公司通过分析历史用户行为数据发现:用户在晚上浏览某商品后,第二天上午完成下单的概率为15‰该公司采用的数据挖掘方法是()”,它指向的核心答案是 C(预测分析)。

备考速记

备考速记:题干如果强调“数据工程”中的关键目标,就先联想到 数据工程;如果选项里出现 孤立点分析、关联分析、数据总结,不要只看名称熟悉,要判断它们是否真正对应题干场景。

数据工程在数据工程场景中的作用

数据工程在本题中的核心价值,是解决“某电商公司通过分析历史用户行为数据发现:用户在晚上浏览某商品后,第二天上午完成下单的概率为15‰该公司采用的数据挖掘方法是()”这个场景问题。复习时不要只背选项名称,还要理解它为什么适用于该场景,以及它能解决哪类安全、流程或管理问题。

拓展

同类题怎么考

  • 给出数据工程场景,判断应该选择哪个概念、工具、协议或管理过程。
  • 考查数据工程的作用,要求从四个相近选项中找出最符合题干目标的一项。
  • 把数据工程和孤立点分析、关联分析、数据总结放在一起考,重点看适用场景是否一致。
  • 题干通常会出现一个关键动作或目标,先定位关键词,再回到选项逐一排除。
数据工程在系统集成项目管理工程师软考中的考法

软考选择题通常不会只考概念定义,还会把数据工程放到数据工程场景中,要求判断它的作用、适用范围或与相近概念的区别。遇到这类题时,先抓住题干中的业务场景,再看哪个选项最能解决该场景下的核心问题。

你可能还想了解

  • 根据历史用户行为预测下单概率属于哪种数据挖掘方法?
  • 数据工程是什么?
  • 数据工程在系统集成项目管理工程师考试中怎么考?
  • 系统集成项目管理工程师数据工程题怎么理解?

本文小结

本题核心考点是数据工程在数据工程场景中的判断和应用。遇到类似题目时,先看题干描述的目标,再判断哪个选项最符合场景;本题应选择 C(预测分析)。