光影描绘女性最美角度 高贵冷艳梦幻人像
17828次查看 15评论
机器学习(ML)通常可用于解决企业内部的各种问题,从结构化和非结构化数据中提取有效信息,并利用它们交付价值。目前,该技术已经进入到企业业务层面,通过发现数据模 ...
机器学习(ML)通常可用于解决企业内部的各种问题,从结构化和非结构化数据中提取有效信息,并利用它们交付价值。 目前,该技术已经进入到企业业务层面,通过发现数据模式到检测异常并提出建议,同时机器学习还可以借助大数据,应用复杂计算来进行预测,进而帮助企业获得竞争优势。不过根据香港IDC新天域互联获悉,在企业执行机器学习过程中,必须考虑这些问题: 1. 数据质量 通常在收集数据时,企业会获取一些被携带的无关紧要数据,而这些数据会严重影响数据分析和关联分析结果。鉴于机器学习极大地依赖数据,这些嘈杂数据的出现会极大影响任何机器学习模型的准确性,尤其是针对预测性应用。 而缺少质量数据也会限制建立机器模型模型的能力,因此,为获取高质量的数据并解决存在的非必要数据,企业需要通过数据清理和数据整体管理来制定有效机器学习策略。 2. 可解释性 毫无疑问,机器学习的发展使人们有可能直接从数据中学习而不是从人类知识中学习。但是,缺乏以人类可以理解的术语来解释或呈现数据的能力,通常称为可解释性,是机器学习中的最大问题之一。 数据中可能存在的偏差的引入也有机会造成机器学习模型道德问题,而机器学习和算法领域的可解释性级别会发生很大变化,因此企业需要选择适当工具和方法来获得解释。 3. 不平衡数据集 在有监督的机器学习中,不平衡的数据集通常涉及两个或多个类,在几个实际数据集中的训练数据中,标签之间存在不平衡。数据集中的这种不平衡可能会影响机器学习的选择、算法的选择过程、模型评估和验证,令这些模型具有较大偏差。 因此要解决不平衡的数据集,需要采取一些策略,例如增强分类算法或平衡训练数据中的类,然后再将数据作为输入提供给机器学习算法。 但无论如何,解决以数据为驱动的问题的必要条件是拥有适宜的基础设施,新天域互联专注香港服务器租用托管,可提供专为大规模并行任务而设计的GPU服务器,支持大数据分析、深度学习、机器学习等高性能工作,以强大性能协助企业对新兴数字技术的追求。 (免责声明:文章内容为本站转载,不代表本站的观点和立场,内容仅供交流和参考。) |