数据集和数据库有什么区别?

时间:2011-10-16 05:41:19

标签: database dataset

数据集和数据库之间有什么区别?如果它们不同,那么如何?

为什么今天很难管理庞大的数据库?!

请独立于任何编程语言回答。

4 个答案:

答案 0 :(得分:19)

在美式英语中,数据库通常表示“有组织的数据集”。数据库通常在数据库管理系统的控制之下,该系统是管理对数据库的多用户访问的软件。 (通常,但不一定。一些简单的数据库只是使用awk和Python等解释语言处理的文本文件。)

在我最熟悉的SQL世界中,数据库包括表,视图,存储过程,触发器,权限和数据等内容。

同样,在美式英语中,数据集通常是指按行和列选择和排列的数据,以供统计软件处理。数据可能来自数据库,但可能不是。

答案 1 :(得分:4)

数据集是数据......通常在表格中,或者可以是XML或其他类型的数据,但它只是数据......它实际上并没有做任何事情。

正如您所知,数据库是数据集的容器,通常在其周围具有内置基础架构以与其进行交互。

我所做的事情并不难以管理庞大的数据。我想你在问一个与研究有关的问题?

答案 2 :(得分:1)

数据集只是一组数据(可能与某人相关,而可能不与其他人相关),而数据库是一种组织/存储数据或数据集的软件/硬件组件。实际上两者都是不同的。

海量数据需要更多基础结构和组件(硬件和软件)或计算能力和存储空间,才能有效地存储或检索数据。更大的数据意味着更多的组件,因此很难。现代数据库提供了良好的基础结构来处理海量数据的处理(读/写),由Microsoft检查数据湖管理,从而广泛管理关系数据或数据集。

答案 3 :(得分:1)

数据库

这两个术语的定义并不总是很清楚。通常,数据库是使用数据库管理系统(DBMS)组织和访问的一组数据。数据库通常(但并非总是)由几个链接在一起的组成,经常由各种用户同时访问,修改和更新。

Cambridge dictionary:

  

计算机中保存的一组结构化数据,尤其是   可以通过各种方式访问​​。

Merriam-webster

  

通常为快速整理而组织的大量数据   搜索和检索(例如通过计算机)

数据集(或数据集)

数据集有时是指单个数据库表的内容,但这是一个限制性的定义。顾名思义,通常来说,数据是一组(或一组)数据,因此存在像Caltech-256 Object Category Dataset之类的图像或视频等数据集。 A large-scale benchmark dataset for event recognition in surveillance video。通常将数据集用于分析目的,而不是针对不同用户进行持续更新,因此代表数据收集的结束或特定时间的快照。

Oxford dictionary:

  

一组相关的信息集合,由   单独的元素,但可以由计算机作为一个整体进行操作。

     

‘所有医院必须提供每位患者的标准数据集   详细信息”

Cambridge dictionary

  

一组单独的信息集,被视为   一台电脑