计算智能导论大作业-第六学期

发布于 2023-02-23  315 次阅读


作业要求:

  1. 个人简历
  2. 对这门课程的理解
  3. 作业的目标
  4. 作业的内容
  5. 作业的总结
  6. 课程的总结
  7. 未来计划
  8. 内容:要求和计算智能相关
  9. 作业邮箱:xdjisuanzhineng@126.com
  10. 截止日期:2022年6月20日
  11. 格式:宋体小四,1.5倍行距,至少5页

作业的内容

在互联网和物联网技术快速发展背景下,计算机存储空 间和计算能力都得到了明显提高,可以实现持续获取海量的数据,这就意味着人们正式走入了大数据时代。大数据技术的价 值是真实而又巨大的,为了能够充分发挥出其中存在的优势,就必须要解决像数据采集和信息抽取处理以及数据分析等技术问题。在此影响下,对数据获取、存储和管理等数据安全服务和隐私保护工作都提出了十分严格的要求,各种云计算信息技术急需硬件设备支持来解决技术问题。 除此之外,计算智能代表着人工智能时代新时期,是一种综合性问题解决方法总称,与传统人工智能技术不同,计算智能不需要建立符合自身问题的模型,也不只是单纯的知识表达,而是在数据观测的基础上进行处理,这一特点很容易处理大数据当中那些传统人工智能技术无法解决的问题。从目前实 际情况来看,计算机技术和人工智能技术都在快速发展,在图像处理以及智能控制等多个领域的应用都十分普遍,并收获了非常理想的成果。然而在不断更新换代的大数据背景下,计算智能方法也面临着一定的挑战。

很多不确定的复杂问题通过计算智能方法都可以轻松解决,同时也非常适合应用于多变且多样化的大数据环境。计算智能方法也面临着很多全新的挑战,大多数应用于小数据层 面的计算智能方法已无法适用于当前海量且高速的大数据计 算中,具体问题如下:受数据规模膨胀的影响,算法时空开销也呈现出持续增涨的趋势,能够被小数据集所接受的计算难度,在大数据中也变得十分困难。其次,从大数据实际应用情况来看,数据是不断变化和更新的,它无法直接传输到计算机主机存储器当中,也无法保留所有的样本数据,更不能像批量计算那样构建出无偏训练集。最后,在大数据时代环境中,数据采集能力和生产能力都在与日俱增,方法也越来越多样,这也使得属性数量在随着数据规模不断扩大而明显增加,数据 信息表现出高维且系数的特征。 对此,面对大数据为计算智能带来的挑战,未来需要重点从以下几个方面进行研究:一是要拓展计算智能算法,以此来更好地处理大规模业务,在问题规模持续扩增的同时,扩展算法模型也会发生相应 的变化。由于大部分计算智能算法研究都是将大数据技术作 为基本出发点,因此这些方法并不只是分析大数据这么简单, 而且关于大数据性能方面的分析也少之又少,如何将存在于小数据集上的计算智能算法转移到大数据集之上,是未来需 要重点研究的问题。从目前实际情况来看,加强算法的可扩展性是解决这类问题的主要手段,常见方法主要有线优化、随机 算法、以哈希为基础的算法和规模较大的集群分布式算法等 四种。因此相关研究人员需要重点分析将这些措施与计算智能算法相结合的有效方法,同时还要考虑如何才能够发展高扩展性的计算智能新算法。在此基础上还要将原始问题进行 简化,在此期间,大规模复杂问题的解决措施就是分而治之, 其关键就是如何抽象划分问题。 二是粒计算的理论与计算模型可以从不同的角度和层次 来进行分析,进而使问题能够得到有效解决,为复杂问题的处 理方式提供新思路。粒计算在应对大数据中复杂问题处理期间具有非常关键的作用,属于一种规范化计算模式,在智能化 信息发展领域十分重要,然而在后期实际应用过程中,还需要探讨如何告别当前初始阶段。三是在分析大数据信息时,考虑是否会用到原数据集中的信息,如果不是,将如何丰富更加高效且丰富的手段,这是需要重点研究的问题。在一些应用中,还需要对部分数据进行采样处理,将满足小数据集特点的传统方式应用于大数据集 当中,通过牺牲部分精确率来减少时空开销。除此之外,在分析大数据集前提下来探索其中所存在的规律,也是一种十分可行的策略。 除了上述几点研究发展之外,因为在很多大数据应用环境下,数据中所蕴含的规律是不断变化和发展的。例如,互联网热点新闻讨论热度会随着时间推移而发生变化,在新闻传播和消失等各个环节中都有不同的变化,因此大数据分析并 不只对某一时段的事件进行提前预测,还要体现数据的动态发展模式,这样才可以充分体现数据中的潜在价值。另外,因为大数据价值密度不高,因此会经常使异常模式突出较高的价值,比如日志数据的故障错误、舆情分析中的敏感事件以及 金融业务中的敲诈行为等等。这些都需要应用发展迅速且可靠的方法来进行检验。

计算智能一般可以认为是人工神经网络、模糊系统以及演化计算三方面相互融合形成的全新计算方法。计算智能算法因其自身特点决定了在大数据分析过程中的重要价值。首先,大数据本身复杂多样且多变的特点决定了模型驱 动方法存在本质上的约束性,面对错综复杂的海量数据信息,通常很难建立精确模型完成演化计算。同时大数据分析通常会随着外界环境发生变化,这都是源自于系统本身和用户的需求等方面在发生变化,传统人工智能方式很难面对这样的环 境变化,这就导致最终算法失去了意义,而通过遗传算法可以根据实际环境来优化种群适应程度。 其次,精度也是大数据环境下的一项重要因素,针对不确定问题的处理和管理需求都源自于数据采集措施和自然环境等其他因素的干扰,在此基础上也有大数据不确定的特点。 所以针对不确定数据的挖掘成为了当前大数据分析过程中的重要问题。 最后,大数据的规模和复杂程度也需要分析较大的时空开 销,但是可能无法在精确的时间内进行分析。计算智能方法拥 有一定的启发性,可以模拟人类和其他生物智慧来得到想要的答案,具有较高的自组织性和自适应性,能够快速解决一些较为棘手的问题,规模庞大的问题处理也因此得到了有效手段。

人工神经网络

人工神经网络是一种在模仿动物神经系统前提下而实现 的分布式信息处理模型,拥有良好的非线性映射能力和容错性,是一种十分关键的计算智能算法。神经网络并不需要掌握 任何先验知识,和传统计算方式相比,约束条件相对较少。从 大数据角度来看,像设备传感器、社交网络以及搜索引擎等, 这些数据都是持续变化的,因此无法像学习算法一样在过去数据中建立起训练集。另外,数据规模与产生的速度也会导致数据无法实现一次性导入。面对这样的问题,需要利用深度在线学习方法,每次分析只需要一个样本数据来更新目标函数即可。在此基础上,感知器也是一种十分传统的在线学习模型,是人工神经网络的重要结构,对于任何一种训练样本,感知器都可以准通过预测结果来判断是否更新和连接权重。如果预测结果正确,那么权重将会不变。否则,就需要结合输入样本特 征来更新。在理论方面,这样的更新手段拥有较低的错误率,经过标准化之后的训练样本将会与最短距离平方呈反比。

模糊系统

在大数据使用过程中,数据很容易受精度和随机性等非可控因素影响,最终会导致大部分数据表现出一定的模糊性。除了在采集期间导入模糊性之外,在实际使用过程中数据也要具备固定模糊性,例如电商网站和服务点评网站等等,用户 可以根据自己的感受来发表言论,这些信息都很难用简单逻辑 来表达,重点是要表达其中的不确定性,用语言来表述更加详细的模糊概念。对于模糊系统的研究属于一种模糊现象,这样的模糊性通常存在于事物的差异性方面,概念外延也因此具有一定的不分明性,使推理结果的可解释性更强,是一种应用十分广泛的计算智能算法。从语言变量描述角度来看拥有非常明显的应用价值。

演化计算与群体智能

以遗传演算为基础的演化计算和粒子群优化等为代表的群体智能计算方法,是应对复杂问题的重要手段。在实际应用期间的优点在于,它不仅可以快速解决一些十分困难的问题。同时还可以用于解决约简问题当中,进而有效解决数据量庞大 的困扰。 遗传算法自身不需要先验知识,目前已广泛应用于解决 复杂问题当中。此外,遗传算法还能够进行数据简化,因为加强决策力和流程优化能力是大数据分析过程中的重要目标之一,所以计算智能算法拥有比传统计算方法更广的应用空间,差异目标优化如今已成为演化计算的重要研究方向。

作业的总结:

综上所述,虽然大数据技术带来了前所未有的发展机遇,但是对信息技术发展带来了一定的挑战。所以必须结合大数据技术特点进行全面分析,并总结归纳其中的计算智能方法应用措施,在分析缺陷问题的前提下,清楚了解未来主要研究方向,解决数据资源共享传输问题,利用丰富且开放的大数据技术最终发挥出计算智能算法的应用潜力,解决各种复杂性问题。

课程的总结

通过计算智能导论这门课,学到了人工智能的产生历史,学到了计算智能领域的研究成果,学到了进化计算方向有关的遗传算法交叉变异适应度函数。学到了模糊逻辑和人工神经网络。