中国统计网|100+数据分析指标术语 | 超全指标字典快收好!(下)( 三 )


  • HDFS:Hadoop分布式文件系统(Hadoop Distributed File System);是一个被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统 。
  • 高性能计算(HPC:High-Performance-Computing):使用超级计算机来解决极其复杂的计算问题 。
  • I
    • 内存数据库(IMDB:In-memory):一种数据库管理系统 , 与普通数据库管理系统不同之处在于 , 它用主存来存储数据 , 而非硬盘 。 其特点在于能高速地进行数据的处理和存取 。
    • 物联网(IoT):最新的流行语是物联网(IOT) 。 IOT通过互联网将嵌入式对象(传感器 , 可穿戴设备 , 汽车 , 冰箱等)中的计算设备进行互连 , 并且能够发送以及接收数据 。 IOT生成大量数据 , 提供了大量大数据分析的机会 。
    K
    • 键值数据库(Key-Value Databases):数据的存储方式是使用一个特定的键 , 指向一个特定的数据记录 , 这种方式使得数据的查找更加方便快捷 。 键值数据库中所存的数据通常为编程语言中基本数据类型的数据 。
    L
    • 负载均衡(Load balancing):将工作量分配到多台电脑或服务器上 , 以获得最优结果和最大的系统利用率 。
    • 位置信息(Location data):GPS信息 , 即地理位置信息 。
    • 日志文件(Log file):由计算机系统自动生成的文件 , 记录系统的运行过程 。
    M
    • M2M数据(Machine 2 Machine data):两台或多台机器间交流与传输的内容 。
    • 机器数据(Machine data):由传感器或算法在机器上产生的数据 。
    • 机器学习(Machine learning):人工智能的一部分 , 指的是机器能够从它们所完成的任务中进行自我学习 , 通过长期的累积实现自我改进 。
    • Map Reduce:是处理大规模数据的一种软件框架(Map:映射 , Reduce:归纳) 。
    • 大规模并行处理(MPP:Massivel yParallel Processing):同时使用多个处理器(或多台计算机)处理同一个计算任务 。
    • 元数据(Meta data):被称为描述数据的数据 , 即描述数据数据属性(数据是什么)的信息 。
    • 多维数据库(Multi-Dimensional Databases):用于优化数据联机分析处理(OLAP)程序 , 优化数据仓库的一种数据库 。
    • 多值数据库(MultiValue Databases):是一种非关系型数据库(NoSQL),一种特殊的多维数据库:能处理3个维度的数据 。 主要针对非常长的字符串 , 能够完美地处理HTML和XML中的字串 。
    N
    • 自然语言处理(Natural Language Processing):是计算机科学的一个分支领域 , 它研究如何实现计算机与人类语言之间的交互 。
    • 网络分析(Network analysis):分析网络或图论中节点间的关系 , 即分析网络中节点间的连接和强度关系 。
    • NewSQL:一个优雅的、定义良好的数据库系统 , 比SQL更易学习和使用 , 比NoSQL更晚提出的新型数据库 。
    • NoSQL:顾名思义 , 就是“不使用SQL”的数据库 。 这类数据库泛指传统关系型数据库以外的其他类型的数据库 。 这类数据库有更强的一致性 , 能处理超大规模和高并发的数据 。
    O
    • 对象数据库(Object Databases):(也称为面向对象数据库)以对象的形式存储数据 , 用于面向对象编程 。 它不同于关系型数据库和图形数据库 , 大部分对象数据库都提供一种查询语言 , 允许使用声明式编程(declarative programming)访问对象 。