Browse Wiki & Semantic Web

Jump to: navigation, search
Http://dbpedia.org/resource/Data lake
  This page has no properties.
hide properties that link here 
  No properties link to this page.
 
http://dbpedia.org/resource/Data_lake
http://dbpedia.org/ontology/abstract A data lake is a system or repository of dA data lake is a system or repository of data stored in its natural/raw format, usually object blobs or files. A data lake is usually a single store of data including raw copies of source system data, sensor data, social data etc., and transformed data used for tasks such as reporting, visualization, advanced analytics and machine learning. A data lake can include structured data from relational databases (rows and columns), semi-structured data (CSV, logs, XML, JSON), unstructured data (emails, documents, PDFs) and binary data (images, audio, video). A data lake can be established "on premises" (within an organization's data centers) or "in the cloud" (using cloud services from vendors such as Amazon, Microsoft, or Google). Poorly-managed data lakes have been facetiously called data swamps. have been facetiously called data swamps. , Un llac de dades (data lake en anglès) és Un llac de dades (data lake en anglès) és un sistema o dipòsit de dades emmagatzemades en el seu format natural / en brut, normalment objectes binaris o fitxers. Un llac de dades és en general un únic magatzem de dades, incloent-hi còpies de dades de sistema base, font de dades de sensors, dades socials, etc., i dades transformades utilitzades per a tasques com ara la presentació d'informes, la visualització, anàlisi avançat i aprenentatge automàtic. Un llac de dades pot incloure dades estructurades de bases de dades relacionals (files i columnes), dades semiestructurades (CSV, registres, XML, JSON), dades no estructurades (correus electrònics, documents, PDF) i dades binàries (imatges, àudio, vídeo). Es pot establir un llac de dades "local" (dins dels centres de dades d'una organització) o "al núvol" (mitjançant serveis de núvol de proveïdors com Amazon, Microsoft o Google ). Un pantà de dades (o data swamp en anglès) és un llac de dades deteriorat i no gestionat que és inaccessible per als usuaris previstos o que aporta poc valor. usuaris previstos o que aporta poc valor. , Ein Data Lake (wörtlich übersetzt "DatenseEin Data Lake (wörtlich übersetzt "Datensee") ist in der Wirtschaftsinformatik ein System oder ein Repository von Daten, die im Rohdatenformat gespeichert sind, normalerweise Blobs oder Dateien. Ein Data Lake ist in der Regel ein einziger Speicher für alle Unternehmensdaten, einschließlich Rohkopien von Quellsystemdaten und transformierten Daten, die für Aufgaben wie Berichterstellung, Visualisierung, erweiterte Analysen und maschinelles Lernen verwendet werden. Ein Data Lake kann strukturierte Daten aus relationalen Datenbanken (Zeilen und Spalten), aus CSV-, XML- oder JSON-Formaten oder unstrukturierte Daten zum Beispiel E-Mails, Dokumente, PDF-Dateien und binäre Daten (Bild, Ton, Speicherabbilder) enthalten. Data Lakes werden in Branchen wie Einzelhandel, Bankwesen oder Hotel- und Gastgewerbe und sogar in der Reisebranche verwendet, für die Verfolgung und die Vorhersage von Kundenvorlieben und die Verbesserung der gesamten Kundenerfahrung. Neben den Daten werden auch generische Analysemethoden abgelegt, sodass diese ebenfalls für die zentral gespeicherten Daten zur Verfügung stehen und nicht im Vorfeld jedes Analyseprozesses zusammengetragen werden müssen. Daher benötigen Data Lakes normalerweise viel mehr Speicherkapazität als Data Warehouses. Darüber hinaus sind unverarbeitete Rohdaten formbar, lassen sich schnell für die unterschiedlichsten Zwecke analysieren und sind ideal für maschinelles Lernen. Ein Datensumpf (data swamp) ist ein nicht verwalteter Data Lake, der entweder für die vorgesehenen Benutzer nicht zugänglich ist oder wenig Wert bietet. Datensümpfe entstehen, wenn keine angemessenen Datenqualitäts- und Data-Governance-Maßnahmen durchgeführt werden.-Governance-Maßnahmen durchgeführt werden. , Un lac de données (en anglais data lake) eUn lac de données (en anglais data lake) est une méthode de stockage de données massives utilisée par le big data (mégadonnées en français). Ces données sont gardées dans leurs formats originaux ou sont très peu transformées. Le lac de données donne la priorité au stockage rapide et volumineux de données hétérogènes en adoptant une architecture en cluster. Il n'est pas optimisé pour les requêtes SQL comme les SGBD relationnels classiques, et s'écarte des Propriétés ACID traditionnelles. On parle depuis 2010 de SGBD NoSQL. Articles détaillés : Big Data et NoSQL. On trouve donc dans un lac de données des données de natures et de sources différentes, telles que : * des données structurées issues notamment de bases de données relationnelles (lignes et colonnes) ; * des données variées issues de bases NoSQL ; * des données semi-structurées (fichiers CSV, journaux, XML, JSON...) ; * des données non structurées (emails, documents, PDF) ; * des fichiers de type blob (images, audio, vidéo notamment). Ces données sont conservées dans le lac de données pour analyse ultérieure. Il s’agit d’une solution de gestion de données hybrides et variées ayant pour objectif de stocker de manière rapide et peu chère une grande quantité de données brutes. La principale qualité du lac de données réside en sa flexibilité. Il doit pouvoir stocker les données, quel que soit leur format. Lorsqu’une donnée est intégrée au sein du Data Lake, elle se voit attribuer un identifiant unique et est marquée au moyen d'un jeu de balises de métadonnées étendues. Lorsqu'un besoin se présente, le Data Lake est parcouru pour y rechercher des informations pertinentes. L'analyse de ces données permet alors d'apporter de la valeur et de répondre à ce besoin.r de la valeur et de répondre à ce besoin. , データレイク (Data lake) は構造化/非構造化データやバイナリ等のファイルデータレイク (Data lake) は構造化/非構造化データやバイナリ等のファイル含めたデータを一元的に格納するデータリポジトリ。一般的に、データレイクはレポート、可視化、分析、機械学習に利用されるエンタープライズのデータのコピーや返還後のデータを一カ所に集約する。データレイクはリレーショナルデータベースの構造化データ(列と行)や、半構造化データ(CSV、ログ、XML、JSON)、非構造化データ(Eメール、ドキュメント、PDF)、バイナリデータ(画像、音声、映像)を含めることができる。 適切に管理されておらず、ユーザが意図するデータへのアクセシビリティが低く、小さな価値しか提供できない低品質のデータレイクはデータの沼と表現される。ティが低く、小さな価値しか提供できない低品質のデータレイクはデータの沼と表現される。 , 数据湖(英語:data Lake),是指使用大型二进制对象或文件这样的自然格式储存数数据湖(英語:data Lake),是指使用大型二进制对象或文件这样的自然格式储存数据的系统 。它通常把所有的企业数据统一存储,既包括源系统中的原始副本,也包括转换后的数据,比如那些用于报表, 可视化, 数据分析和机器学习的数据。数据湖可以包括关系数据库的结构化数据(行与列)、半结构化的数据(CSV,日志,XML, JSON),非结构化数据 (电子邮件、文件、PDF)和 二进制数据(图像、音频、视频)。 储存数据湖的方式包括 Apache Hadoop 分布式文件系统, Azure 数据湖 或 's云存储服务,以及诸如 Alluxio 虚拟数据湖之类的解决方案。 一个 数据沼泽 是一个劣化的数据湖,用户无法访问,或是没什么价值。之类的解决方案。 一个 数据沼泽 是一个劣化的数据湖,用户无法访问,或是没什么价值。 , Data lake é um repositório utilizado para Data lake é um repositório utilizado para armazenar todos os dados estruturados e não estruturados. Ao armazená-los de forma não estruturada pode-se realizar diferentes tipos de análise, incluindo processamento de big data, análise em tempo real e machine learning, a fim de adquirir melhores decisões. Além disso, o data lake aproveita mais dados, de mais fontes, em menos tempo e todos os dados são mantidos, mesmo depois de finalizados eles ficam armazenados para próximas análises. Dessa forma, as empresas podem utilizar os dados da maneira que preferem e estão investindo no Data Lake cada vez mais.tão investindo no Data Lake cada vez mais.
http://dbpedia.org/ontology/wikiPageID 46626475
http://dbpedia.org/ontology/wikiPageLength 8715
http://dbpedia.org/ontology/wikiPageRevisionID 1118313118
http://dbpedia.org/ontology/wikiPageWikiLink http://dbpedia.org/resource/Map_Reduce + , http://dbpedia.org/resource/Google_Cloud_Storage + , http://dbpedia.org/resource/Unstructured_data + , http://dbpedia.org/resource/PricewaterhouseCoopers + , http://dbpedia.org/resource/Emails + , http://dbpedia.org/resource/Teradata + , http://dbpedia.org/resource/Relational_database + , http://dbpedia.org/resource/XML + , http://dbpedia.org/resource/Cambridge_Semantics + , http://dbpedia.org/resource/Big_data + , http://dbpedia.org/resource/Binary_data + , http://dbpedia.org/resource/Information_silo + , http://dbpedia.org/resource/Metadata + , http://dbpedia.org/resource/Google + , http://dbpedia.org/resource/Apache_Spark + , http://dbpedia.org/resource/Data_mart + , http://dbpedia.org/resource/Azure_Data_Lake + , http://dbpedia.org/resource/Data_analytics + , http://dbpedia.org/resource/PDFs + , http://dbpedia.org/resource/Hortonworks + , http://dbpedia.org/resource/MongoDB_Inc. + , http://dbpedia.org/resource/Category:Data_management + , http://dbpedia.org/resource/Cloudera + , http://dbpedia.org/resource/Data_reporting + , http://dbpedia.org/resource/Amazon_%28company%29 + , http://dbpedia.org/resource/Audio_data + , http://dbpedia.org/resource/Zaloni + , http://dbpedia.org/resource/Data_warehouses + , http://dbpedia.org/resource/Data_repository + , http://dbpedia.org/resource/Amazon_S3 + , http://dbpedia.org/resource/Apache_Pig + , http://dbpedia.org/resource/JSON + , http://dbpedia.org/resource/Category:Cloud_storage + , http://dbpedia.org/resource/Cardiff_University + , http://dbpedia.org/resource/Binary_large_object + , http://dbpedia.org/resource/Extract%2C_transform%2C_load + , http://dbpedia.org/resource/Hadoop_distributed_file_system + , http://dbpedia.org/resource/Machine_learning + , http://dbpedia.org/resource/Comma-separated_values + , http://dbpedia.org/resource/Data_visualization + , http://dbpedia.org/resource/Oracle_Cloud + , http://dbpedia.org/resource/Microsoft + , http://dbpedia.org/resource/Pentaho + , http://dbpedia.org/resource/Apache_Hive + , http://dbpedia.org/resource/Apache_Hadoop + , http://dbpedia.org/resource/Structured_data + , http://dbpedia.org/resource/Amazon_Web_Services +
http://dbpedia.org/property/wikiPageUsesTemplate http://dbpedia.org/resource/Template:Short_description + , http://dbpedia.org/resource/Template:Cquote + , http://dbpedia.org/resource/Template:Reflist + , http://dbpedia.org/resource/Template:Use_dmy_dates +
http://purl.org/dc/terms/subject http://dbpedia.org/resource/Category:Cloud_storage + , http://dbpedia.org/resource/Category:Data_management +
http://purl.org/linguistics/gold/hypernym http://dbpedia.org/resource/Repository +
http://www.w3.org/ns/prov#wasDerivedFrom http://en.wikipedia.org/wiki/Data_lake?oldid=1118313118&ns=0 +
http://xmlns.com/foaf/0.1/isPrimaryTopicOf http://en.wikipedia.org/wiki/Data_lake +
owl:sameAs http://az.dbpedia.org/resource/Veril%C9%99nl%C9%99r_g%C3%B6l%C3%BC + , http://no.dbpedia.org/resource/Datasj%C3%B8 + , http://pt.dbpedia.org/resource/Data_Lake + , http://ja.dbpedia.org/resource/%E3%83%87%E3%83%BC%E3%82%BF%E3%83%AC%E3%82%A4%E3%82%AF + , http://de.dbpedia.org/resource/Data_Lake + , http://zh.dbpedia.org/resource/%E6%95%B0%E6%8D%AE%E6%B9%96 + , http://dbpedia.org/resource/Data_lake + , http://simple.dbpedia.org/resource/Data_lake + , http://be.dbpedia.org/resource/%D0%92%D0%BE%D0%B7%D0%B5%D1%80%D0%B0_%D0%B4%D0%B0%D0%BD%D1%8B%D1%85 + , http://fa.dbpedia.org/resource/%D8%AF%D8%B1%DB%8C%D8%A7%DA%86%D9%87_%D8%AF%D8%A7%D8%AF%D9%87 + , http://ca.dbpedia.org/resource/Llac_de_dades + , https://global.dbpedia.org/id/y8Vj + , http://www.wikidata.org/entity/Q20707560 + , http://rdf.freebase.com/ns/m.0136zzks + , http://fr.dbpedia.org/resource/Lac_de_donn%C3%A9es + , http://es.dbpedia.org/resource/Lago_de_datos +
rdf:type http://dbpedia.org/ontology/Work +
rdfs:comment Un llac de dades (data lake en anglès) és Un llac de dades (data lake en anglès) és un sistema o dipòsit de dades emmagatzemades en el seu format natural / en brut, normalment objectes binaris o fitxers. Un llac de dades és en general un únic magatzem de dades, incloent-hi còpies de dades de sistema base, font de dades de sensors, dades socials, etc., i dades transformades utilitzades per a tasques com ara la presentació d'informes, la visualització, anàlisi avançat i aprenentatge automàtic. Un llac de dades pot incloure dades estructurades de bases de dades relacionals (files i columnes), dades semiestructurades (CSV, registres, XML, JSON), dades no estructurades (correus electrònics, documents, PDF) i dades binàries (imatges, àudio, vídeo). Es pot establir un llac de dades "local" (dins dels centres de dades d'una organització) dels centres de dades d'una organització) , Ein Data Lake (wörtlich übersetzt "DatenseEin Data Lake (wörtlich übersetzt "Datensee") ist in der Wirtschaftsinformatik ein System oder ein Repository von Daten, die im Rohdatenformat gespeichert sind, normalerweise Blobs oder Dateien. Ein Data Lake ist in der Regel ein einziger Speicher für alle Unternehmensdaten, einschließlich Rohkopien von Quellsystemdaten und transformierten Daten, die für Aufgaben wie Berichterstellung, Visualisierung, erweiterte Analysen und maschinelles Lernen verwendet werden. Ein Data Lake kann strukturierte Daten aus relationalen Datenbanken (Zeilen und Spalten), aus CSV-, XML- oder JSON-Formaten oder unstrukturierte Daten zum Beispiel E-Mails, Dokumente, PDF-Dateien und binäre Daten (Bild, Ton, Speicherabbilder) enthalten.n (Bild, Ton, Speicherabbilder) enthalten. , A data lake is a system or repository of dA data lake is a system or repository of data stored in its natural/raw format, usually object blobs or files. A data lake is usually a single store of data including raw copies of source system data, sensor data, social data etc., and transformed data used for tasks such as reporting, visualization, advanced analytics and machine learning. A data lake can include structured data from relational databases (rows and columns), semi-structured data (CSV, logs, XML, JSON), unstructured data (emails, documents, PDFs) and binary data (images, audio, video). A data lake can be established "on premises" (within an organization's data centers) or "in the cloud" (using cloud services from vendors such as Amazon, Microsoft, or Google).ors such as Amazon, Microsoft, or Google). , Un lac de données (en anglais data lake) eUn lac de données (en anglais data lake) est une méthode de stockage de données massives utilisée par le big data (mégadonnées en français). Ces données sont gardées dans leurs formats originaux ou sont très peu transformées. Le lac de données donne la priorité au stockage rapide et volumineux de données hétérogènes en adoptant une architecture en cluster. Il n'est pas optimisé pour les requêtes SQL comme les SGBD relationnels classiques, et s'écarte des Propriétés ACID traditionnelles. On parle depuis 2010 de SGBD NoSQL. Articles détaillés : Big Data et NoSQL.L. Articles détaillés : Big Data et NoSQL. , 数据湖(英語:data Lake),是指使用大型二进制对象或文件这样的自然格式储存数数据湖(英語:data Lake),是指使用大型二进制对象或文件这样的自然格式储存数据的系统 。它通常把所有的企业数据统一存储,既包括源系统中的原始副本,也包括转换后的数据,比如那些用于报表, 可视化, 数据分析和机器学习的数据。数据湖可以包括关系数据库的结构化数据(行与列)、半结构化的数据(CSV,日志,XML, JSON),非结构化数据 (电子邮件、文件、PDF)和 二进制数据(图像、音频、视频)。 储存数据湖的方式包括 Apache Hadoop 分布式文件系统, Azure 数据湖 或 's云存储服务,以及诸如 Alluxio 虚拟数据湖之类的解决方案。 一个 数据沼泽 是一个劣化的数据湖,用户无法访问,或是没什么价值。之类的解决方案。 一个 数据沼泽 是一个劣化的数据湖,用户无法访问,或是没什么价值。 , Data lake é um repositório utilizado para Data lake é um repositório utilizado para armazenar todos os dados estruturados e não estruturados. Ao armazená-los de forma não estruturada pode-se realizar diferentes tipos de análise, incluindo processamento de big data, análise em tempo real e machine learning, a fim de adquirir melhores decisões. Além disso, o data lake aproveita mais dados, de mais fontes, em menos tempo e todos os dados são mantidos, mesmo depois de finalizados eles ficam armazenados para próximas análises. ficam armazenados para próximas análises. , データレイク (Data lake) は構造化/非構造化データやバイナリ等のファイルデータレイク (Data lake) は構造化/非構造化データやバイナリ等のファイル含めたデータを一元的に格納するデータリポジトリ。一般的に、データレイクはレポート、可視化、分析、機械学習に利用されるエンタープライズのデータのコピーや返還後のデータを一カ所に集約する。データレイクはリレーショナルデータベースの構造化データ(列と行)や、半構造化データ(CSV、ログ、XML、JSON)、非構造化データ(Eメール、ドキュメント、PDF)、バイナリデータ(画像、音声、映像)を含めることができる。 適切に管理されておらず、ユーザが意図するデータへのアクセシビリティが低く、小さな価値しか提供できない低品質のデータレイクはデータの沼と表現される。ティが低く、小さな価値しか提供できない低品質のデータレイクはデータの沼と表現される。
rdfs:label Data Lake , Llac de dades , Lac de données , 数据湖 , Lago de datos , Data lake , データレイク
hide properties that link here 
http://dbpedia.org/resource/Apache_Iceberg + http://dbpedia.org/ontology/genre
http://dbpedia.org/resource/Data_graveyard + , http://dbpedia.org/resource/Data_swamp + http://dbpedia.org/ontology/wikiPageRedirects
http://dbpedia.org/resource/Presto_%28SQL_query_engine%29 + , http://dbpedia.org/resource/Data_virtualization + , http://dbpedia.org/resource/Starschema + , http://dbpedia.org/resource/Data_hub + , http://dbpedia.org/resource/Zaloni + , http://dbpedia.org/resource/Databricks + , http://dbpedia.org/resource/OpenIO + , http://dbpedia.org/resource/Data_wrangling + , http://dbpedia.org/resource/Apache_Iceberg + , http://dbpedia.org/resource/Extract%2C_load%2C_transform + , http://dbpedia.org/resource/Government_procurement_in_the_United_Kingdom + , http://dbpedia.org/resource/Data_mesh + , http://dbpedia.org/resource/Timeline_of_Amazon_Web_Services + , http://dbpedia.org/resource/Data_management_platform + , http://dbpedia.org/resource/Streaming_data + , http://dbpedia.org/resource/Dell_EMC_Isilon + , http://dbpedia.org/resource/List_of_big_data_companies + , http://dbpedia.org/resource/Big_data + , http://dbpedia.org/resource/Microsoft_Power_Platform + , http://dbpedia.org/resource/Federated_search + , http://dbpedia.org/resource/Cyc + , http://dbpedia.org/resource/Fashion_capital + , http://dbpedia.org/resource/Data_integration + , http://dbpedia.org/resource/Extract%2C_transform%2C_load + , http://dbpedia.org/resource/Kaltura + , http://dbpedia.org/resource/Amazon_S3 + , http://dbpedia.org/resource/Customer_data_platform + , http://dbpedia.org/resource/Azure_Data_Lake + , http://dbpedia.org/resource/M1_%28Singaporean_company%29 + , http://dbpedia.org/resource/Trino_%28SQL_query_engine%29 + , http://dbpedia.org/resource/Data_graveyard + , http://dbpedia.org/resource/Data_swamp + , http://dbpedia.org/resource/Datalake + http://dbpedia.org/ontology/wikiPageWikiLink
http://dbpedia.org/resource/Apache_Iceberg + http://dbpedia.org/property/genre
http://en.wikipedia.org/wiki/Data_lake + http://xmlns.com/foaf/0.1/primaryTopic
http://dbpedia.org/resource/Data_lake + owl:sameAs
 

 

Enter the name of the page to start semantic browsing from.