Abstract
近年来,数据所有权日益重要,引起了广泛关注,这不仅反映了其在不断发展的数据驱动环境中的关键作用,也反映了在不同情况下解决这一问题的复杂性。为数据平台开发有效数据所有权概念的必要性是无可争议的;然而,这个过程本质上是复杂的,需要全面审查围绕这一多方面问题的要求。本文提出了一种开发数据所有权概念的新方法,该方法借鉴了需求工程 1(RE)的原理。通过深入的案例研究评估了这种方法的有效性,重点关注三个不同的背景:在智能电表、智能畜牧业和能源数据空间领域开发数据所有权概念。通过应用RE原则,这项工作力求提供一种结构化且有效的方法来应对在为数据驱动平台和应用程序开发数据所有权概念的过程中与数据所有权相关的细微挑战。
数据所有权;数据主权;需求工程;需求引出;智能电表;数据空间;智能畜牧业;隐私;安全
1 简介
在利用数据带来的优势和确保隐私保护之间取得公平的平衡至关重要。建立透明、强大的数据所有权框架不仅有助于保障数据权利,而且可以增进信任,促进有效、安全地利用数据。 从本质上讲,有效管理数据所有权是充分发挥数据潜力同时遵守道德和隐私标准的基本要素。根据Abbas 等人 (2024)的说法,“数据所有权是指个人或组织对其数据拥有的合法权利和控制权,包括管理、共享和处置数据的能力”。相比之下,数据主权包括一个更广泛的框架,它超越了所有权,整合了保护、提供和参与等方面。数据所有权主要强调个人或组织权利,而数据主权则考虑集体责任以及影响数据管理和共享实践的背景因素[ref1]。
制定有效的数据所有权概念需要对此类概念的一般要求进行全面研究和分析。需求工程(RE)流程在确保数据所有权概念的有效性、道德性和用户接受度方面起着根本性的作用。 此过程需要识别和分析相关利益相关者 2,促进对他们的需求、期望和担忧的理解。这种协调可确保在制定数据所有权概念时全面考虑所涉及的各种利益,促进包容性和利益相关者满意度。它还有助于映射法律要求、道德准则和行业标准,确保概念完全合规。 这不仅可以确保法律合规,还可以培养用户信任。此外,进行彻底的需求引出有助于确定安全和隐私要求并预测未来的变化,确保概念能够适应新兴技术和不断变化的用户需求。
在概念化和设计新的基于数据的系统、软件或平台的背景下,数据所有权相关方面经常被忽视,或作为总体开发要求的一部分以有限的方式得到解决。这种疏忽可能导致无法解决确保数据所有权保护所必需的关键要素。例如,在可再生能源过程中缺乏数据所有权可能会造成权利混乱,阻碍可持续创新,使法律合规变得更加复杂,同时也导致需求和工件之间的不一致[ref2]。这种管理不善造成了数据的使用、访问和控制的模糊性,尤其是在异构项目环境中[ref3]。
虽然人们普遍承认数据所有权的必要性,但目前在可再生能源过程中实施数据所有权的方法有限。这种差异凸显了数据所有权的概念理解与实际融入可再生能源之间的差距。同样,数据所有权要求并非普遍一致,可能因具体情况而异。因此,为了全面满足每种情况下的必要要求,必须采用结构化方法。这种方法应以预定步骤和明确定义的数据所有权特征和方面为前提。因此,本研究探讨了以下研究问题:“如何将数据所有权概念有效地纳入可再生能源过程,以确保适当考虑不同利益相关者的权利和利益?”
这项工作的目的是提供一种路线图方法,以便在任何情况下引出与数据所有权相关的要求。为了评估该方法在不同情况下的适用性,评估将通过三个不同领域的三个案例研究进行。这项工作是之前发表的一项研究的延续[ref4],该研究调查了数据所有权的概念,并引入了一个描述数据所有权新定义的概念模型 3。这项工作将以前一项研究的结论为基础,利用上述数据所有权概念模型结合需求工程的原则来引出数据所有权概念开发的要求。需求工程原则在整个过程中提供了必要的指导,数据所有权概念模型提供了需要解决的数据所有权的特征和方面。
本研究的第一部分全面概述了可再生能源和数据所有权的原则。随后的章节将应用可再生能源的原则来解决数据所有权问题。通过三个案例研究展示了该方法,重点介绍了其在数据所有权概念开发中的应用。本研究最后讨论了该方法及其适用性。
2 2.材料和方法
2.1 需求工程
典型的需求工程涉及理解和分析三个维度:应该解决什么问题、为什么需要解决该问题以及问题解决过程中的相关参与者是谁[ref5]。处理和分析解决数据所有权相关问题的需求类似于此过程,需求工程的三个维度可以作为解决此类问题的基础。
可再生能源的”为什么”维度涉及理解问题的现状和转型必要性背后的原因。为了解决这个问题,除了掌握问题本身之外,还必须采取一系列行动。首先,必须获取有关问题所在领域的知识。这包括理解概念、法规、程序和术语等方面。随后,应根据问题世界中的替代可能性的优缺点对其进行评估,同时考虑到潜在的影响和风险。最后,必须确定该过程的目标以及将参与可再生能源过程的利益相关者[ref5]。
需求工程的”什么”维度深入研究了实现”为什么”维度中确定的目标所需的要求,重点是确定所需解决方案的服务、约束和假设。这些要求可以分为功能性要求和非功能性要求。功能性要求描述了所需解决方案的功能效果,并回答了”解决方案应该做什么?“的问题。相反,非功能性要求定义了所需解决方案应如何满足定义的功能要求的约束,从而回答了”解决方案应如何满足这些要求?“的问题。非功能性要求还包括质量要求,质量要求规定了所需解决方案的功能效果应具备的质量相关属性,从而回答了”解决方案的性能应该如何?“的问题。[ref5]。这些要求至关重要,特别是在解决数据所有权概念等问题时。例如,隐私通常被视为非功能性质量要求。虽然隐私过去更多地被视为社会和法律问题,但近年来,它越来越多地出现在软件应用中。尤其是在收集大量数据或存储个人数据时,用户信任起着重要作用[ref6]。然而,它的保证与对数据所有权的理解密切相关。例如,隐私要求将决定在特定情况下是否需要数据所有者的同意才能披露私人信息。一个合适的隐私RE 工具是卡内基梅隆大学软件工程研究所 (SEI) 开发的P-SQUARE,它可以帮助组织确定其软件系统的隐私要求[ref7]。
最后,“WHO”维度描述了在所需解决方案的组件和参与者之间实现目标、服务、约束和已确定需求的责任分配。这包括但不限于系统、人员、部门、组织、设备或软件。要进行需求工程流程,必须开展涉及各种利益相关者的各种活动。虽然具体活动可能因来源不同而有所不同,但该流程通常涉及以下活动:领域理解、需求引出和分析、需求规范,以及最终的需求验证 4和确认[ref5]。
如前所述,领域理解旨在从不同方面全面描绘当前情况。理解问题领域需要研究的方面可能因领域和问题本身的不同而不同,也因RE 过程的期望结果而异。然而,领域理解通常包括以下方面 [ref5]:
- 了解领域和问题;
- 了解组织背景;
- 了解技术背景;
- 了解该问题的法律层面;
- 定义参与该过程的利益相关者;
- 了解当前状况,包括其优势和劣势。
必须理解这些方面,特别是组织、技术和法律层面,才能理解必要的数据所有权要求。例如,在组织环境中,理解现有的组织结构、决策层级、业务流程和工作流程对于制定数据所有权概念是必要的,该概念要考虑到特定组织需要什么以及该概念将如何影响组织。
同样,在法律背景下,在解决数据所有权等法律相关主题的要求时,除了了解国家法律、行业和制造商法律法规以及欧洲通用数据保护条例 (GDPR) 等一般法律等外部法律方面外,了解组织规则和限制、知识产权和版权以及具有约束力的协议等内部法律方面也是不可避免的。
最后,了解技术背景也至关重要,包括一般的技术基础设施、可用的系统和工具、这些系统之间的通信以及当前实施的安全和隐私措施,以确定开发数据所有权方法的要求,以增强或替换当前的功能或系统。
需求获取在文献中通常被认为是需求工程过程中最重要和最关键的活动之一。获取正确的需求是一个必不可少但又困难的步骤,它会影响需求工程的成功和整个开发过程[8、9、10、11、12]。
需求获取主要涉及根据通过领域理解收集的信息识别候选需求。它围绕从问题领域中发现、提取和获取必要的知识展开,然后将其转化为有用的需求。因此,获取过程旨在了解各利益相关者的期望、需求、要求和约束,并将其转化为明确、[可理解][和]可验证[的]需求[8、9、10、11、13、14]。
引出过程是一个复杂的过程,涉及各种活动,可以通过使用各种可用技术来完成[ref8]。选择合适的技术取决于可用的资源,以及需要引出的信息类型[ref15]。
有多种技术可用于引出需求。审查或研究这些技术的各种研究在一定程度上同意将它们归类为一组类别,这些类别总结了可以使用的方法(见图1)。当然,这些类别中列出的方法可能因领域而异,并且可能会出现对引出过程有用的新方法。
- 传统技术:
- 顾名思义,此类别包括收集通用数据的基本和传统技术。通常,此类别包括结构化和非结构化形式的访谈 5、调查、问卷以及从现有文档中收集数据等技术[11、15、16 ]。一些文献还包括其他方法,如会议、任务分析和自省。当缺乏答案[和]反馈时,自省会很有用;需求分析师可能需要想象需要什么样的需求[ref9] 。
- 协作或小组启发技术:
- 这些技术旨在通过获得利益相关者、用户和参与该过程的团队的同意来更好地理解需求。它们还有助于确定必要需求的优先级 6。此类别包括焦点小组、头脑风暴和研讨会等技术,例如快速应用程序开发 (RAD) 和联合应用程序开发 (JAD)[ref9] ,[ref11] ,[ref15] ,[ref16] 。
- 原型设计 7技术:
- 当需求不确定且需要反馈时,可以在引出过程中使用原型。它也可以作为讨论或进一步引出过程的基础[ref15] ,[ref16] 。原型有两种类型:一次性原型,可用于更好地理解需求;进化原型,代表结果的简化工作版本,以后可以成为最终结果的一部分[ref11] 。
- 模型驱动或建模技术:
- 此类别围绕使用特定模型来说明需要收集的信息,这些信息将在后续的引出过程中使用。这包括基于目标的方法(如KAOS 和 I)和基于场景的方法(如 CREWS [ref15] )。它还包括业务流程建模方法,如 UML、业务流程建模符号 (BPMN) 和数据流 8图 [ref11] , [ref16] 。
- 认知技巧:
- 这些技术优先考虑知识的获取,因此涵盖了需要获取知识的各个领域的一系列多学科方[ref9] ,[ref15]。这些技术涵盖了一系列方法,包括协议分析、阶梯式方法、卡片分类、知识库网格、本体和邻近缩放技术[ref9] ,[ref11] ,[ref15] ,[ref16] 。
- 语境技巧:
- 这些技术旨在直接从情境中引出需求,以更好地理解社会和组织行为。它们收集有关利益相关者及其工作的所有方面的丰富数据,包括环境、流程、模型和工作流程[ref16]。这些技术包括参与观察 9等民族志方法,以及民族方法学、对话和社会分析以及社会技术方法 [9、11、15、16]。
除了上述类别之外,Sharma 和 Pandey还添加了一个名为”创新技术”的类别,其中列出了需求获取的新技术[ref9]。

在引出过程之后,需要对引出的需求进行评估和验证。有许多技术可用于评估和验证,但本文不讨论这些技术,因为它们超出了本文的范围。在后续章节中,我们将探讨数据所有权的概念及其各种特征和方面。本次探索旨在证明在数据所有权概念的开发中采用 RE 技术的必要性。
2.2 数据所有权
在不断发展的数据管理领域,数据所有权的概念仍然难以捉摸且含糊不清。数据量和复杂性的不断增加,加上技术的进步,使数据所有权成为数字时代的一个关键问题。数据所有权是指个人或实体对生成、收集或处理的数据所拥有的合法和道德权利。在个人数据的背景下,数据所有权通常意味着对如何使用、共享和存储这些数据的控制和权限。它包括个人决定谁可以访问其信息以及出于何种目的访问其信息的权利。在商业或组织环境中,数据所有权可能包括与在运营过程中生成或获取的数据相关的权利和责任。虽然个人可能拥有自己的个人数据,但组织通常声称拥有其系统内生成的数据的所有权。数据所有权的不断发展受到法律框架、行业法规以及有关数字权利和隐私的持续讨论的影响。
尽管人们普遍认为数据所有权是对数据权的完全控制,但要给出统一的定义却并非易事。欧盟委员会一项倡议的最新研究表明,欧盟层面的立法并未明确数据所有权的确切含义,潜在数据所有权的范围同样模糊不清[ref17]。在相当多的情况下,数据所有权与数据主权等其他主题交织在一起。数据主权可被视为类似于数据所有权,因为它涉及对数据的合法权利、监管和控制。另一方面,数据所有权超越了数据占有的法律后果,还涉及数据所有者的数据权利和责任。数据所有权的复杂性超出了简单的观点,需要对多种观点、法律含义和其他后果有细致的理解。
在之前发表的一项研究中 [ref4],对数据所有权问题进行了最新研究。该研究分析了数据所有权问题的各个方面及其复杂性。它还概述了欧洲和德国数据所有权的法律方面,并调查了五个主要行业数据所有权的最新情况。该研究表明,数据所有权的概念远非简单,不像有形资产或财产的所有权,而是引入了各种复杂性和复杂性。该研究还揭示了围绕该问题的固有模糊性。一方面,目前没有普遍接受的术语定义。另一方面,数据所有权的基本问题——“谁拥有数据?”——缺乏一个直接的答案,而缺乏涵盖该问题细微变化的全面规则则加剧了这一问题。此外,即使确定或同意了所有者,保留数据所有权的要求仍然不明确。
该研究的结论是,任何满足特定案例目标和要求的数据方面都与制定针对该特定场景的数据所有权概念相关。这意味着需要引出所考虑案例的不同要求。为了总结这些发现,该研究提供了数据所有权的定义,并将其呈现为一个概念模型,

该模型将作为对所需要求进行分类的基础。概念模型定义了数据所有权的基本要素以及在制定数据所有权概念时必须解决的特征。概念模型由两个主要部分组成。第一部分包括定义数据所有权本质的特征,包括以下内容:数据所有权、数据权利、控制所有权、授予数据权利和责任。第二部分描述了数据所有权的基础,包括制定数据所有权概念时需要考虑的方面,包括以下内容:法律方面、道德方面、数据类型、技术要求和案例要求。有关数据所有权概念模型的进一步解释可以在Asswad 和 Gómez 的先前著作中找到 [ref4]。
从我们之前的研究来看,数据所有权是”对数据的占有和控制,包括向他人授予数据权利的能力,同时考虑到数据的类型、法律和道德方面、对数据的责任以及保存和实现这种占有所需的要求”[ref4]。
3 数据所有权概念的需求工程方法
解决数据所有权问题的复杂性和模糊性要求在为特定案例制定数据所有权概念时采用更清晰的方法。本部分工作提出了一种新颖的方法,该方法应用 RE 原则来引出在任何给定案例中制定数据所有权概念的要求。

该方法仅关注 RE 过程的两个步骤,即领域理解和需求获取。RE过程的后续步骤不属于该方法,因为它们将在后续工作中解决,其中将分析和验证基于本文提出的方法获取的数据所有权需求,以便将它们集成到数据所有权参考模型中,以实现数据所有权概念。
在这种方法中,领域理解不仅会研究案例的领域,还会分析与所考虑案例中数据所有权相关的相关方面。对于引出过程,将根据预定义的数据所有权需求类别探索需求。在下面的 第3.1 节 和第 3.2节中,将进一步阐明该方法的两个步骤。
3.1 领域理解
如本文前面所述,了解问题世界所处的领域是 RE的第一步。因此,本文提出的方法从对案例的一般领域理解开始,包括两个主要部分。第一部分是对案例所基于领域的理解。同时,第二部分是对数据所有权领域的理解,其中分析和理解此特定案例所需的数据所有权的特征。
我们之前的研究 [ref4] 从不同角度和不同领域研究了数据所有权问题。它还提出了数据所有权的定义,并在概念模型中进行了描述(见图2),该模型总结了研究结果和最新进展。该概念模型可用于涵盖部分领域理解,并可作为数据所有权概念开发需求引出的基础。
概念模型认为,在任何情况下处理数据所有权问题都需要考虑和纳入一系列全面的方面和特征。在可行的数据所有权概念范围内,保持对数据的拥有和控制至关重要。这一概念应涵盖对数据的各种权利的所有权,包括向第三方授予某些权利的能力。此外,数据所有权还涉及对所拥有的数据承担责任。
这五个特征定义了对数据所有权的基本理解。因此,在分析案件领域时,需要探索和理解这五个方面。这意味着必须针对具体案件回答以下五个问题:
- 谁拥有/持有这些数据?
- 谁拥有数据的权利?
- 谁控制数据的所有权?
- 谁可以授予数据权利?
- 谁对数据负责?
除了这五个特征之外,还需要确定可能参与该过程的利益相关者。数据所有权概念所涉及的利益相关者可能因情况而异,但大多数情况下,数据所有权相关概念中都有一组利益相关者,例如:
- 数据所有者
- 数据提供者
- 数据用户/消费者
- 数据存储库
数据所有者基本上是拥有数据权利的人,包括将这些权利授予第三方的权利。数据用户/消费者是想要访问和使用数据的人。数据提供者是向数据用户/消费者提供数据或将数据存储在合适的持久性介质中的人。最后,数据存储库是存储和维护数据的地方。
然而,这些利益相关者的角色 10或复杂性可能因情况而异或相互交织。在某些情况下,数据提供者可能是与数据所有者相同的人/实体。在其他情况下,数据用户可能是其他用户的另一个数据提供者。此外,数据存储库比存储数据的地方更复杂。在大多数情况下,它是数据平台、数据管理系统或其他类型系统的一部分,这又增加了一层复杂性。另一方面,如果其他利益相关者也是概念的一部分,那么定义的利益相关者之间的角色以及动态关系和互动可能会有所不同,包括对数据的或多或少的权利。由于缺乏关于数据所有权和数据所有者权利的法律确认,因此需要识别所有数据利益相关者并理解他们在每种特定情况下的关系和互动。这种理解对于理解本案中的数据所有权并将责任分配给正确的利益相关者至关重要。
为了说明这种互动,我们以与能源供应商 11签订了电力合同的人为例:尽管此人的消费数据应属于他们自己,但在很多情况下,这些数据属于能源供应商。根据《通用数据保护条例》(GDPR),此人对其个人数据拥有某些权利,包括访问和下载其信息的权利以及将其遗忘的权利。必须认识到,个人与能源供应商签订的电力合同本质上并不将其个人消费数据的所有权转移给供应商。尽管如此,《通用数据保护条例》(GDPR)承认个人访问、下载和删除其数据的权利。但是,个人与能源供应商之间的合同协议或约束性安排可能会授予供应商对数据的额外权利,例如处理和分析数据的权利、将数据传输给第三方的权利,甚至将数据用于商业目的的权利。在这个特定的例子中,签订合同的人不是数据所有者,而是数据提供者,而能源供应商是数据所有者。如果要将数据传输给第三方,则该第三方即为数据用户或数据消费者。能源供应商的门户网站(包括其后端存储)被指定为数据存储库。为了定义在这种情况下主张数据所有权所需的功能性或非功能性要求,必须全面了解这些利益相关者之间可能存在的各种互动以及每个利益相关者的权利。
3.2 需求引出
在理解领域之后,该方法继续进行需求获取过程。为了捕捉数据所有权概念的相关需求,获取过程将根据数据所有权概念模型的基础进行指导,并分为特定类别。
虽然上一段介绍的五个特征定义了数据所有权的本质,但要设计和概念化一个强大的数据所有权概念,它必须建立在坚实的基础之上。这个基础决定了应该在多大程度上和以何种方式考虑概念的特征。首先,基础包括对案件法律方面的理解,包括但不限于国家法律、组织法规、具有约束力的协议和制造商限制。它还考虑了案件的道德层面,特别是当案件涉及医疗、个人或敏感数据时。了解所涉数据的性质是建立坚实基础的关键要素。数据类型可能会影响方法的特征或处理该特定类型数据所需的复杂性。此外,数据所有权方法的基础应建立在对案件本身的透彻理解之上。例如,必须决定实施概念的规模:是在平台、系统、组织、城市还是国家内。基础还必须考虑在多大程度上应用该概念以保留特定案件中的数据所有权。最后,基础部分应包含对案例技术要求的全面理解。这包括考虑是否要在遗留或现有系统之上实施该概念,还是从头开始构建。其他技术要求可能包括考虑使用特定技术或一组技术进行实施。
综上所述,数据所有权概念模型介绍了定义数据所有权理解的五个方面和特征。此外,它还提出了五个类别的基础,可作为启动需求获取过程的基础。数据所有权概念模型的五个特征和五个基本类别是根据我们进行的深入最新研究的结果定义的, 我们回顾了数据所有权的一般和法律方面,并调查了能源、交通、医疗、工业和智慧城市等五个主要领域的数据所有权考虑因素 [ref4] 。
如前所述,有多种技术可用于获取需求。但是,为了构建和最大化所获得的信息,开发数据所有权概念所需的需求将根据[图 2中先前介绍的数据所有权概念模型的基础进行分类]。这意味着获取过程将收集以下类别的信息:
- 法律方面的要求;
- 道德方面的要求;
- 数据要求;
- 技术要求;
- 案例要求。
可以使用任何适当的引出技术来收集这些类别的信息,具体取决于案例和所需的背景研究。图3中显示为统一建模语言 (UML)活动图。
在下一节中,我们将通过三个案例研究来说明所介绍的方法,这些案例研究涉及不同情况下的数据所有权。在这些案例研究中,我们将探索案例领域,并使用不同的引出技术来收集制定适合该案例的数据所有权概念所需的必要条件。
4 4.案例研究
在本文的这一部分,将在三个不同的案例研究中应用和评估所介绍的方法。通过三个案例研究介绍该方法的目的是强调该方法在不同领域和不同数据所有权要求中的适用性。每个案例研究的结构如下:首先概述案例和当前问题。本部分还将包括对案例领域的基本了解。接下来,将介绍一种方法,包括所使用的不同需求引出技术。在下一步中,将介绍引出过程的初步结果。根据数据所有权的概念模型,这些结果在两个表中呈现。一个表介绍了案例的数据所有权特征,代表该方法的领域理解部分,第二个表介绍了预期实施案例数据所有权概念的必要要求,代表该方法的需求引出部分。
第4.1节介绍了一个案例研究,该案例研究讨论了在基于智能电表的实施中开发数据所有权概念的必要性。随后,第4.2节中的案例研究涉及精准畜牧业,并讨论了整个养猪生产价值链中的数据所有权问题。最后一个案例研究在第4.3节中介绍,并讨论了在能源数据空间背景下利益相关者之间数据交换的数据所有权问题。
4.1 案例研究:智能电表
本案例研究探讨了德国智能电表的数据所有权问题,目的是确定在德国环境下开发智能电表数据所有权概念的必要要求。
智能电表将在即将到来的能源网中发挥关键作用,因为它们为消费者和生产者的能源消费模式提供了宝贵的见解。然而,近年来,德国智能电表的实施经历了重大延迟,特别是由于涉及不同利益相关者,对开发过程的要求各不相同 [ref18]。虽然利用电表数据为提高电网效率提供了巨大机会 [ref19],但在智能电表实施的背景下,数据所有权问题也随之出现。
德国目前正在全国范围内推广智能测量系统(iMSys),也称为智能电表,目的是加强电网监控和效率。iMSys由两个主要部分组成:现代测量系统和智能电表网关。智能电表网关充当处理和传输数据的通信单元,而现代测量系统是反映实际能耗和实际使用时间的数字电表[ref20] 。
智能电表提供的新数据将为配电系统运营商 (DSO) 优化电网提供实质性帮助。这将使 DSO能够做出数据驱动的决策并增强电网管理。通过使用智能电表,DSO可以深入了解能源消耗模式,确定效率低下的领域,并实施必要的调整以减少能源浪费并提高电网的整体可持续性 [ref19] 。
在目前的德国,计量点运营商 (MSB)负责测量、收集和分发来自智能电表的能源数据。MSB 的运营受《测量点运营法》(MsbG) 的管辖 [ref21] 。MSB负责为最终消费者配备智能电表,并将测量值直接分发给所有授权的外部市场参与者,包括DSO。在大多数电网区域,DSO 承担了 MSB 的角色,承担了 MSB 的职责。
在此背景下,有四个主要利益相关者与智能电表数据进行交互:
- 最终消费者:购买电能或通过本地分散发电机生产电能的自然人或法人。
- 计量点运营商(MSB):负责电力表的安装、操作、读数和维护以及实际计量过程的实体。
- 配电系统运营商 (DSO):运营电力和天然气网络并向最终消费者(私人家庭和小型消费者)配电的公司。
- 第三方:代表 DSO 处理数据的自然人或法人、公共主管部门、机构或其他机构。
在德国,最终消费者与 DSO(例如公用事业公司)之间签订了合同协议,允许 DSO 收集和处理消费者的能源消耗数据,以提供能源服务。电表收集的数据被传输到 MSB 并由 MSB 存储,然后 MSB 将数据转发给 DSO。随后,DSO可以处理电表数据以支持其运营或将其传输给第三方服务提供商,如图4所示。

如第3.1节所述,数据所有权领域通常涉及四个关键利益相关者。然而,在智能电表的背景下,这些利益相关者紧密交织在一起。数据所有者位于最终消费者和DSO之间,因为这两个实体都拥有数据权利。数据用户/消费者、数据提供者和数据存储库是DSO,尽管 DSO 可以授权第三方承担这些角色。
4.1.1 方法论:智能电表
在执行需求获取过程时,我们遵循了第 3 节中描述的结构化方法。这种方法可以全面获取智能电表的需求。为了更深入地了解案例,我们首先进行了彻底的分析,详见 第4.1节。该分析提供了宝贵的见解,指导选择适当的获取技术。我们选择了传统方法,包括从文献、法律法规中的现有和相关研究中收集数据、非结构化访谈以收集定性数据以及问卷调查以收集结构化数据。这些方法使我们能够获得不同的视角并全面了解需求。
4.1.1.1 背景研究和文献综述
对智能电表基础设施的需求不断增长,带来了有关数据所有权的新挑战,数据所有权问题仍未得到解[ref22]。德国法律体系不承认个人数据的所有权 [ref23]。然而,根据欧洲通用数据保护条例 (GDPR) 中对个人数据的定义,智能电表数据被视为个人数据,因此受到 GDPR的保护,GDPR 为数据隐私和保护制定了一些指导方针 [ref24]。尽管如此,仍然缺乏确定哪些数据属于客户以及哪些数据必须受到公用事业保护的法律法规[ref25] 。
智能电表实施的主要问题与隐私有关,因为这些设备会收集高频消费数据,从而提供有关消费者行为的详细见解。这些信息可用于创建准确的个人资料并出于各种目的监视用户[26,27,28]。与隐私有关的]其他问题包括公用事业和第三方可能使用消费者数据进行定向广告,以及根据观察到的行为对用户进行差别对待[ref19][]。能源系统的效率不应以牺牲消费者隐私为代价来实现。智能电表有可能使公用事业公司有效地管理能源需求和供应;然而,它们的实施必须以可信和透明的方式进行[ref19]。
为了应对智能电表数据隐私方面的挑战,出现了许多概念。一个典型的例子是Cavoukian 等人提出的概念 [ref19],该概念让消费者控制自己的数据,并确保消费者是任何系统的焦点,同时保证能源网的功能。另一方面,Wang等人 [ref28]提出了一种不同的方法,在确保数据隐私的同时,促进能源网参与者之间的数据共享行为。
为了在使用智能电表数据时保护消费者隐私,已经提出了各种数据保护方法,包括数据匿名化[ref29]、数据加密[ref30]和区块链技术[ref28]。虽然匿名化是一个相对简单的过程,但它并不一定能保证全面的隐私,因为存在重新识别的可能性[29,31][]。加密技术的优势在于可以保留原始数据,然而,加密技术在计算上很复杂,成本高昂[ref31]。区块链技术的应用被认为是解决困扰当前数据交换过程的所有权和隐私问题的潜在解决方案。该技术因其确保数据安全的能力而闻名,然而,它是否能有效应对与其技术成熟度和支持大规模运营的能力相关的挑战仍有待观察[ref32]。
4.1.2 非结构化访谈和问卷调查
鉴于该主题的复杂性,出现了一系列与数据所有权要求引出过程相关的问题。为了回答这些问题,我们对一位数据所有权专家进行了一次非结构化访谈,这位专家对数据所有权的RE 过程提供了宝贵的见解。访谈包括有关数据所有权的一般理解的问题,包括围绕该问题的法律和道德方面。此外,专家还被问及解决数据所有权的最新情况和已知要求。专家概述了数据所有权的基础知识,并解释了解决数据所有权的复杂性和不确定性,特别是在不同情况下在不同背景下解决它时。专家进一步确认,基于需求工程的方法定义特定的数据所有权要求将有助于理解在特定情况下确保数据所有权的必要方面。在专家访谈期间,介绍了智能电表案例研究,专家确认许多方面都需要直接与DSO进行审查,因为他们拥有管理智能电表数据和回答未解决的问题所需的专业知识。因此,我们与专家共同为DSO制定了一份问卷,以收集他们的意见,并进一步加深对数据所有权概念必要要求的理解。这份问卷经过精心设计,包含多项选择题和开放式问题,涵盖以下主题:
- 智能电表数据及其衍生信息的预期用途和权利。
- 对数据的责任和控制。
- 政府和公司关于智能电表数据利用的规定。
- 访问控制。
- 数据安全和隐私。
与案例研究中的 DSO合作伙伴进行了结构化访谈,以回答问卷并确定数据所有权的必要条件。两家德国公用事业公司参与了案例研究,并接受了单独采访,以确保每家公用事业公司都提供其独特的观点和见解,而不会受到其他公司的潜在影响。值得注意的是,一家公用事业公司提供的答复完全基于受访者的知识和经验,而第二家公用事业公司寻求法律建议来回答一些问题。最后,对访谈进行了定性分析,这为了解这两家公用事业公司在使用智能电表数据方面的经验和理解提供了宝贵的见解。定性分析检查了所提供答案的完整性。问卷的每个答复都经过深入的分析和讨论,如果有歧义,则从DSO 那里获得进一步的阐述和解释。
4.1.3 初步结果:智能电表
对文献综述和访谈的结果进行了全面分析,然后将这些结果映射到数据所有权概念模型(图2)。该分析得出了关于数据所有权方面的几个关键发现(表1),并阐明了数据所有权类别的必要要求(表2)。该分析提供了有关所需数据所有权概念复杂性的宝贵见解。本研究的结果(包括智能电表中数据所有权概念的要求以及与数据所有权方面相关的发现)列于下表中。
表 1.智能电表: 数据所有权特征
姓名 | 描述GDPR |
---|---|
数据权利 | 授予最终消费者有关其智能电表数据的多项权利。这些权利包括访问权、更正权、被遗忘权和停止数据处理的权利。此外,GDPR还授予控制者某些权利,例如我们案例中的DSO。这些权利包括收集、读取、写入、处理、分析和删除数据的能力。 |
数据占有与控制 | 智能电表数据的所有权和控制权归DSO所有,DSO有权通过签订合同或法律协议将上述所有权和控制权转移给第三方。 |
数据责任 | DSO对智能电表数据负有责任。这意味着DSO负有道德和法律义务,以监督智能电表数据的收集、存储、处理和使用,确保其准确性、安全性 12、隐私性并符合相关法规和标准。 |
授予权利 | 最终消费者是向DSO授予智能电表数据权利的人。但是,通过服务合同,他们赋予公用事业公司向第三方授予权利的权力。 |
表 2.智能电表: 数据所有权要求
姓名 | 描述智能电表 |
---|---|
法律方面 | 数据应按照GDPR处理(https://gdpr - info.eu/issues/personal - data/) (2025年2月3日访问)和MsbG (https://www.gesetze - im - internet.de/messbg/) (2025年2月3日访问) 。DSO在收集、处理或分析最终消费者的数据之前,必须通过合同协议获得最终消费者的明确同意。 在共享智能电表数据之前,DSO应该与第三方建立合同协议。 一旦不再需要用于预期目的,可与个人关联的智能电表数据应根据法律要求删除或匿名化。 |
道德方面 | DSO应确保智能电表数据仅用于支持电网的运营,严格遵守适用的数据保护法规,并实施必要的数据隐私和安全保障措施。对智能电表数据的访问应限制在提供服务所需的最少信息量。 |
数据要求 | 智能电表数据应符合MsbG中概述的规范和指南,包括但不限于数据的格式、结构和内容,以及数据传输的协议和标准。 |
案例要求 | 在征求最终消费者同意时,应以通俗易懂的语言和方式提供有关将收集哪些数据以及出于何种目的的详细信息。最终消费者应该能够访问他们的智能电表数据,并且访问方式应该简单明了。可以链接到个人的智能电表数据应匿名或假名化。 |
技术要求 | 应保护智能电表数据免受未经授权的访问,包括实施适当的技术措施来保护数据,如加密、访问控制和安全通信协议。数据保护措施应在设计和默认状态下实施。 具体而言,数据保护措施应嵌入数据处理工作流程中,并采用优先考虑安全性和隐私性的默认设置,除非被授权方以合法理由明确推翻。 |
4.1.4 案例研究摘要:智能电表
智能电表中数据所有权的要求错综复杂,需要仔细考虑才能确保遵守法律和道德标准。为了全面了解这些要求,我们采用了一系列旨在引出与数据所有权相关的要求的技术。这一过程允许收集不同的观点,并在智能电表中为数据所有权概念制定一个全面的框架。这些要求对于确保负责任地处理智能电表数据、尊重个人隐私和安全至关重要。我们的研究结果有助于建立一个在智能电表管理中实施DO概念所必需的强大框架。遵守这些要求使组织能够在处理智能电表时有效地实施数据所有权概念。
4.2 案例研究:精准畜牧养殖
在本章中,我们将研究德国精准畜牧养殖 (PLF)领域的一个用例。与智慧城市一样,智慧农业一词也变得越来越普遍。在这种情况下,数据所有权在确保农民控制其运营和敏感数据方面起着至关重要的作用。养猪生产价值链会产生大量数据,包括动物健康记录、兽医投入、猪舍气候数据和死亡率。当今可用的许多管理解决方案都是以软件即服务(SaaS) 的形式提供的,这意味着数据通常由外部提供商而不是农民自己控制。
在此背景下建立明确的数据所有权的目的是保护农民的数据主权,防止对第三方平台的依赖,并实现安全透明的数据共享。这不仅支持遵守文件和透明度法规,而且还加强了对动物福利实践和供应链的信任。
消费者越来越关心诸如”我的肉来自哪里?“和”猪是怎么养的?“等问题。[ref33]这一趋势凸显了建立透明、防篡改、可追溯的文档系统的重要性。这样的系统确保消费者可以轻松获取有关其食品来源和状况的可靠信息,从而增强对食品安全和道德实践的信任。
由于众多国内和国际因素,德国养猪业及其相关经济部门的结构在过去几十年中发生了重大变化。从 2010 年到 2019年,德国养猪场的数量减少了约三分之一,而生猪数量仅略有下降,这表明养猪业正在向规模化发展[34,35] 。到 2019年,德国每个农场饲养的猪只数量比十年前增加了三分之一,这引起了利益相关者对养猪生产透明度和可追溯性的担忧[ref36] 。
在下萨克森州,结构性变化导致农场专业化程度提高,生猪生产集中在特定区域,从而给供应链的各个环节带来了新的技术、物流、社会和经济挑战[ref37]。这些挑战包括与动物福利、管理、咨询服务、大量文件要求、可持续性、环境影响、肉类生产中的劳动和收入条件、疾病和消费者保护(“同一个健康”方法),以及数据交换(包括数据主权和供应链中所有参与者之间的安全)有关的问题。最近在德国发生的COVID-19 疫情和非洲猪瘟疫情,暴露了信息和数据交换方面存在严重缺陷,凸显出利益相关者之间缺乏合适的接口和程序[ref38]。此外,出于食品安全、动物和消费者保护的目的,社会、贸易和监管机构越来越要求整个生猪供应链(从农场到餐桌)提高透明度和加快可追溯性,这表明通过有针对性的数字化进步具有巨大的改进潜力[ref39]。
4.2.1 方法论:精准畜牧养殖
在我们研究的初始阶段,至关重要的是要获得猪从受精到成为消费品的复杂过程的视觉表现(从农场到餐桌)(https://food.ec.europa.eu/horizo。为此,我们使用BPMN(一种用于描述业务流程的图形建模标准)开发了一个模型。通过与养猪业内各种合作伙伴的磋商,该模型得到了精心完善。该模型的基础是一个试点猪舍,它已经配备了全面的物联网(IoT) 传感器,为分析提供了丰富的数据集。除了为 BPMN奠定基础外,我们的初步研究还阐明了与该行业相关的法律文件要求。这项探索有助于绘制整个养猪生产价值链的数据流,为养猪业的运营和监管环境提供见解。
我们开发了一个用例图来表示各种利益相关者及其角色,并定义基本流程 13中的所有权。该图涵盖了一系列协议,从简单的指导方针(如删除所有用户数据和规定时间序列数据的保留期限)到涉及的不同利益相关者之间更复杂的角色分配。这种结构化方法有助于清晰地了解责任和权利,确保各方都了解他们在系统内的职责和特权,从而增强数据管理流程的治理和运营清晰度。
通过研讨会 14和与养猪业利益相关者(包括农民、兽医和技术提供商)的访谈,我们了解了需求。这些会议用于完BPMN流程模型,并确定符合客户期望、监管要求和案例研究框架的现实目标。案例研究小组内的各种专业知识不仅有助于概述研究目标,还有助于建立具体的里程碑,这些里程碑反映了对研究范围、客户需求和监管要求的平衡考虑,从而为研究的进展规划了明确的前进道路。
4.2.2 初步结果:精准畜牧养殖
我们检查了 BPMN、文献综述和用例图的结果,并将其与数据所有权 (DO)概念模型相链接(见图[ref2]),揭示了数据所有权各个方面的重大见解,并强调了不同类别数据所有权的基本标准。通过应用上述技术,可以发现许多第三方供应商目前都提供了全面的解决方案来集中管理这些数据量,这本质上将用户与其专有生态系统绑定在一起。因此,数据只存储在这些提供商的云基础设施中。此外,市场上的许多传感器都是来自第三方实体的预配置解决方案,通常只提供专有接口。这些供应商经常对启用数据访问(例如通过MQTT协议收取费用,这进一步加深了对其系统的依赖,并限制了数据管理和集成的灵活性。
为了解决数据所有权挑战,提出了一种分布式账本技术(DLT),这是一种去中心化且防篡改的账本系统,使用区块链来确保透明度和控制。在这种方法中,每头猪都被分配了去中心化标识符(DID),它们是全球唯一的数字标识符,可创建与其数据记录的安全链接。敏感数据(例如健康记录或死亡率)存储在链下,而区块链则记录访问权限和交易。这种设置允许农民通过可验证的凭证和同意管理来控制谁可以访问他们的数据,遵循自我主权身份(SSI)系统的原则,用户管理自己的数字身份而不依赖集中式权威。该系统由合作社或政府机构等受信任的实体运营,确保中立并维护数据主权。通过使用区块链,数据共享变得可追溯且防篡改,支持供应链中的透明度和隐私。在这个解决方案中,每只猪都被分配了DID( https://www.w3.org/TR/did-core/ ),这有助于在区块链上创建指向其数据的安全链接。通过将此区块链的运营委托给合作社或政府机构等受信任的实体,可以确保用户维护数据主权。这种方法不仅可以增强数据安全性和隐私性,还可以通过将数据控制权归还给合法所有者来赋予利益相关者权力。[40、41]所强调的,区块链技术因其去中心化和安全性而被提议作为增强畜牧业数据透明度和可追溯性的一种手段。然而,[42]认为,利益相关者意识低、行业协调问题以及主要供应商能力有限等挑战阻碍了其广泛应用。尽管尚处于应用的早期阶段,但正如[43]所证明的,人们正在努力利用区块链提高生猪供应链的可追溯性。当前的战略 15旨在让所有利益相关者参与到生猪生产价值链中,引入自主主权身份(SSI) 等创新方法和新系统,以在数据交换和认证过程中改善隐私和数据所有权。
精准畜牧养殖(PLF)中数据所有权实施方面的标准在随后的表3和表4中概述,并附上了有关数据所有权要求方面的见解。
表 3. PLF: 数据所有权特征
姓名 | 描述 |
---|---|
数据权利 | SSI系统中的利益相关者可以分配各种权利,例如时间序列保留时间的长度、限制不包含个人数据的数据发布以及删除链下数据。链上数据无法被随后删除或更改,但如果不分配,则毫无用处。 |
数据占有与控制 | 由于区块链的去中心化解决方案,数据处于网络所有参与者的控制之下。网络参与者本身拥有数据。去中心化存储解决方案将确保数据由每个参与者冗余存储,但只有所有者才能实际访问其数据。 |
数据责任 | 数据责任目前还不是重要的。 |
授予权利 | 农民可以使用去中心化身份自行决定要发布哪些数据。不存在具有扩展权限的上级实例,也不需要自行授予权限。 |
表 4. PLF: 数据所有权要求
姓名 | 描述系统必须确 |
---|---|
法律方面 | 保遵守适用于个人数据处理的通用数据保护条例 (GDPR) 要求。这包括但不限于确保从收集到处理再到删除的数据隐私和保护,为数据主体提供访问、更正、删除或移植其数据的能力,在设计和默认情况下实施数据保护原则,以及维护处理活动的记录。 |
道德方面 | 生成的数据必须遵守有关数据处理、参与者隐私和透明度的道德标准。这涉及获得所有参与者的知情同意,确保匿名性和数据保护。应采取措施匿名化参与者数据并保护个人信息。 |
数据要求 | 该软件必须支持时间序列数据的管理,以及各种附带文件,包括兽医文件、资格和证书。 这需要根据用户请求或系统要求存储、检索、更新和删除此类数据和文档的能力。 |
案例要求 | 维护数据收集的法律基础和保护个人数据的具体步骤的记录。定义将合法获取的非个性化数据与个性化数据相结合的机制,优先考虑数据安全和消费者隐私。 |
技术要求 | PLF 数据必须存储在链下,以确保数据访问的可扩展性和效率。此外,必须保护数据流量(包括但不限于MQTT通信),以保障传输过程中数据的完整性和机密性。 |
在这个 PLF用例中,数据不仅包括牲畜数据,还包括兽医记录、农民相关数据、来自畜舍的气候数据以及死亡率(例如死猪数量)等敏感的运营数据。即使从法律意义上来说不是个人数据,这些信息对于农民的竞争力、透明度和合规性也至关重要。明确的数据所有权可确保农民保持对其数据的控制,防止对第三方提供商的依赖,并支持供应链中的信任和可追溯性。这些因素决定了表4中列出的要求。
4.2.3 案例研究摘要:精准畜牧养殖
本案例研究考察了德国的精准畜牧业,强调了数据所有权和智能养殖实践日益增长的重要性。养猪业产生大量数据,主要通过基于云的服务进行管理,这引发了人们对数据主权的担忧,以及对确保消费者透明度和可追溯性的系统的需要。
为了解决这些问题,本研究利用 BPMN 绘制猪从受精到消费者的旅程图,整合了试点猪舍的物联网传感器数据。通过使用 BPMN 系统地模拟猪从受精到消费者的每个旅程阶段,这种方法提供了数据交换和监管检查点的结构化可视化。这种详细的映射使人们能够识别关键的法律要求和数据治理中的差距,最终提高透明度和监管合规性。
研讨会旨在使研究目标与监管和客户期望保持一致,从而探索分布式账本技术(DLT) 和 DID作为恢复数据主权的解决方案。尽管整个行业在采用和协调方面面临挑战,但该研究仍提倡使用区块链技术来提高数据透明度和可追溯性。
4.3 案例研究:能源数据空间
本案例研究的目的是利用人工智能 (AI)方法进行风险预测。人工智能和数据的结合应用于评估德国各经济部门能源供应可用性或可靠性的风险。案例研究需要利用从不同来源获得的各种数据集。例如,必须使用数据集来减轻停电或更大事件(如停电)的风险,其中之一就是停电数据集。该数据集主要由配电系统运营商(DSO)提供。这些数据集的使用引发了一些需要解决的问题。这些问题包括参与方之间数据交换的透明度以及对使用和交换数据的所有权的保留。
在本案例研究中,必须通过开源软件(即通过 openKONSEQUENZ 提供的GridFailureInformation(德语:Störungsinformationstool) [44,45]促进参与的 DSO、输电系统运营商(TSO)、当局和消费者之间的通信和数据交换]。此外,该软件应配备专用的数据连接器,其目的是促进指定数据空间内的数据交换。该连接器必须遵守国际数据空间协会(IDSA) 制定的标准[46]。数据空间的目标是使利益相关者能够安全地共享数据,同时保留对数据访问和使用的控制。此外,应促进各个行业之间的数据共享[ref47]。再者,数据基础应由电网拓扑、天气数据和其他数据集(例如,与停电、电力消耗和特定行业需求相关的历史事件)补充,以识别源自能源部门的危机情景。案例中的工具应能够实施对策,可以以对策目录的形式提前设计。
4.3.1 方法论:能源数据空间
鉴于需求的通用性,解决特定领域内的问题所需的具体需求至关重要。需求可以通过各种方法和途径来获取。因此,在能源领域,有多种方法和途径可以用于获取此类需求。例如,头脑风暴 16和原型设计是两种可以应用于能源领域以获取需求的技术,重点是数据、数据隐私、能源和可持续性。当前的案例研究将展示如何应用各种方法来产生与能源领域数据空间相关的需求。
为了从获取过程中获得一组高质量的需求,可以结合不同的方法。在整个过程中,使用了各种需求分析方法。在第一阶段,进行了头脑风暴会议,以了解案例研究的范围及其在能源数据空间环境中的适用性。头脑风暴会议结束后,确定了一份潜在有用用例的候选名单。这些用例是初始案例研究的一部分。在确定这些用例之后,采用专门的方法对其进行分析。需求识别过程的设计方法用于用例设计和筛选,在[ref48]中进行了描述。此后,将定义的用例合并为一个统一的案例研究。该案例研究包括收集的数据,并结合了利益相关者、问题定义、目标、数据源、数据接口、相关方和其他组成部分等关键要素。在合并过程之后,最终确定了需求和核心目标。在初步需求确定并最终确定之后,对数据范围进行了分析。
智能电网架构模型方法(UCMR)用于说明案例研究的后续步骤。UCMR是一个框架,有助于构建和可视化智能电网系统的复杂性,重点关注互操作性。它可以用作组织和构建用例的辅助工具[ref49] 。
4.3.2 初步结果:能源数据空间
案例研究数据分析和人工智能方法应用的初步结果可在 [ref50]中找到。引用的工作利用数据和人工智能 (AI)方法的力量,探索了它们以主动、自适应和可扩展的方式处理危机管理的潜力。它旨在将被动响应转变为主动的数据驱动策略,通过智能危机管理服务建立复原力。虽然这项工作没有实现用于数据集成的数据空间,但它可以作为概念证明,展示集成此类数据的好处。
下一步是转向主动数据分析和主动数据共享。否则,数据孤岛将只用于解决一小部分问题,并且缺乏整合其他潜在有用案例研究的灵活性。尽管打破这样的数据孤岛可能具有挑战性,但以这种形式存储数据可能会带来重大风险[ref51] 。表5 中的描述显示了 图2 数据所有权概念模型的五个类别与能源数据空间案例研究的相关性。表6中的描述展示了 图2 中概念模型的五个基础类别在以需求引出为重点的能源数据空间案例研究中的应用。需求是通过与能源部门的利益相关者以及非能源领域的专家举行的研讨会和访谈引出的。初始用例场景草案是使用[ref52]中描述的需求识别流程创建的。这个特定的需求识别过程包括一种定义用例场景和相关需求的结构化方法。该过程利用了研讨会和访谈。后来与利益相关者的会议用于创建和完善更精确的用例场景。这次,使用UCMR 模板来构建用例场景,以及捕获和完善需求。
表 5.能源数据空间: 数据所有权特征。
姓名 | 描述 |
---|---|
数据权利 | 数据权利应考虑如下方面:处理危机情况所需数据的法律方面、GDPR,以及DSO、TSO和顾客。 |
数据占有与控制 | 部分数据由配电系统运营商 (DSO) 和输电系统运营商 (TSO) 拥有和控制。停电数据由TSO公开共享,DSO收集、处理停电数据,然后将其传达给TSO。 |
数据责任 | DSO有责任收集停电数据,并将这些数据公开传达给TSO(例如,每年)和客户(例如,按需求)。 |
授予权利 | 数据应由DSO、TSO和消费者共享。 然而,尚不清楚消费者究竟如何影响数据收集的必要性,因为部分数据是稳定电网和减轻进一步停电风险所必需的。 |
表 6.能源数据空间: 数据所有权要求。
姓名 | 描述 |
---|---|
法律方面 | 人们对如何以不违反《通用数据保护条例》(GDPR)的方式在技术上实现分析师实用数据(例如个人和非个人)的组合的理解仍然有限。 |
道德方面 | 应考虑多种道德考量。在中断期间,服务双方(提供商和消费者)对重要数据的访问都可能中断。此外,用户隐私需要谨慎处理和安全存储,以防止未经授权的访问或滥用。 |
数据要求 | 只要多方在交换数据,数据要求就应该符合DO概念。 |
案例要求 | 在大多数情况下,消费者同意提供其数据是由法律规定的;但是,这些数据不是个性化的。因此,应包括特殊步骤,以便利用这两种类型的数据,无论是执法部门收集的数据(例如,用于计费目的)还是个性化数据(例如,在特定位置发生的停电)。 |
技术要求 | 所涉及服务(例如服务提供商、数据消费者等)之间的数据交换应以安全的方式进行,并确保防止未经授权的行为。 |
4.3.3 案例研究总结:能源数据空间
案例研究的初步结果表明,基于集成数据可以获得有价值的结果。然而,应进一步研究集成数据孤岛在数据所有权要求方面的缺点。例如,应该提到的是,必须显著提高所用软件(例如数据空间连接器[ref46])的成熟度,并在能源领域实现更广泛的适应性。否则,尽管应用了考虑数据所有权的精心规划的方法,例如 RAM IDS参考架构模型,但实施上述概念在技术上仍将具有挑战性。这将导致在现实场景中集成数据所有权概念时必须解决的额外挑战和问题[ref53] 。
5 5.讨论
在当今数字时代,数据已成为众多应用程序和系统运行的基本要素。然而,存在许多障碍,阻碍了数据在各种情况下的最佳利用。一个突出而普遍的挑战涉及数据所有权问题。除了必须保护正在生成和积累的大量数据外,这些数据中很大一部分包含个人信息,需要保护。因此,确保数据所有权不仅仅是像通常认为的那样保护数据和隐私;它对于确保整个生命周期的可持续数据管理也至关重要。数据所有权的可行方法包括保留数据的所有权及其相关权利,包括授予或撤销这些权利的能力。所提出的方法全面考虑了各种问题,包括使用数据的法律和道德影响、数据本身的性质、预期实施的技术先决条件以及在每种不同情况下可能出现的补充要求。
因此,为了制定可行的数据所有权概念,必须了解和分析围绕案例和概念实施的要求。需求工程方法为实现这一目标提供了合适的出路。尽管需求工程最初是作为系统和软件工程开发的一部分使用的,但它提供了一种解决数据所有权概念及其复杂性的完美方法。一方面,它从对所考虑案例领域的初步了解开始。另一方面,它提供了一系列需求引出技术,可用于提取相关的数据所有权需求。
所介绍的三个案例研究有力地说明了该方法的适用性。在三个不同案例中应用该方法产生了针对数据所有权概念开发的相关需求。所介绍的方法提供了一种结构化方法,有助于利用需求工程工具集来引出与以下五个类别相关的数据所有权需求:法律、道德、数据、技术和案例需求。这三个案例研究的共同点是采用结构化方法,首先确定问题及其领域。这种方法涉及应用各种需求引出技术,从而为五个数据所有权类别生成相关需求。
如前所述,数据所有权问题错综复杂,无法用普遍适用的解决方案来解决。然而,通过实施指导方针,可以首先理解特定情况下数据所有权概念的必要性。因此,它提供了一个有条不紊、有组织的流程,用于确定特定情况下的必要要求。
6 结论
这项工作引入了一种新方法,用于分析和发现在任何给定情况下开发数据所有权概念的需求。这项工作的第一部分介绍了该方法的基础,首先概述了成熟的需求工程流程 17。它强调了需求工程作为理解手头问题以及定义、指定和分析解决问题所需需求的系统过程的重要性。然后,本文概述了文献中提到的不同需求引出技术。本文继续概述数据所有权的概念及其复杂性。它强调了对越来越多的数据保留所有权的必要性,并强调了数据所有权超出了其对数据及其权利的控制权的普遍定义,要求认真考虑不同的观点。
因此,本文采用我们前期工作 [ref4]中数据所有权的定义和概念模型作为该方法的基础。该模型提出了定义数据所有权的五个特征:数据的所有权、对数据的权利的所有权、对所有权的控制权、授予数据权利的能力以及对给定数据的责任。该模型强调了开发涵盖特定案例的这五个特征的数据所有权概念的坚实基础的必要性。根据该模型,这个基础应该涵盖五个不同的方面:法律方面、道德方面、数据类型、技术要求和案例要求。
本文提出的方法优先考虑领域理解和需求从需求工程过程中获取。对于领域理解,建议除了对问题领域有基本的了解外,还必须确定和理解数据所有权概念及其五个特征。对于获取过程,该方法建议利用需求获取技术来探索和定义建立数据所有权概念的需求,具体培养上述基础方面的五个类别的需求。本文的其余部分通过来自不同领域的三个不同案例研究来评估该方法及其适用性。
6.1 作者贡献
- 概念化,JA;
- 方法论,JA;
- 调查,VD、MEEG 和 CT;
- 写作-原始草稿准备,JA、VD、MEEG、CT 和JK;
- 写作-审查和编辑,JA、VD、MEEG、CT 和 JK;
- 监督,JA
所有作者均已阅读并同意手稿的出版版本。
6.2 资金
这项研究没有接受外部资助。
6.3 数据可用性声明
本研究未创建或分析新数据。
6.4 利益冲突
作者声明没有利益冲突。
7 参考引用
Abbas, A.E.; van Velzen, T.; Ofe, H.; van de Kaa, G.; Zuiderwijk, A.; de Reuver, M. Beyond control over data: Conceptualizing data sovereignty from a social contract perspective. Electron. Mark. 2024, 34, 20. CrossRef
Panis, M.C. An Analysis of Requirements-Related Problems that Occurred in an organization Using a Mature Requirements Engineering Process. In Proceedings of the 2020 IEEE 28th International Conference on Requirements Engineering, Zurich, Switzerland, 31 August–4 September 2020. CrossRef
Ragnostad, O.A. ‘Data ownership’ ambiguity. In Promoting Sustainable Innovation and the Circular Economy; Routeledge: London, UK, 2020; pp. 114–133.
Asswad, J.; Marx Gómez, J. Data Ownership: A Survey. Information 2021, 12, 465. CrossRef
Van Lamsweerde, A. Requirements Engineering: From System Goals to UML Models to Software; John Wiley & Sons: Chichester, UK, 2009; Volume 10.
Kalloniatis, C.; Kavakli, E.; Gritzalis, S. Addressing privacy requirements in system design: The PriS method. Requir. Eng. 2008, 13, 241–255. CrossRef
Institute, S.E. CERT SQUARE for Privacy (P-SQUARE); Carnegie Mellon University: Pittsburgh, PA, USA, 2012.
Zowghi, D.; Coulin, C. Requirements Elicitation: A Survey of Techniques, Approaches, and Tools. In Engineering and Managing Software Requirements; Aurum, A., Wohlin, C., Eds.; Springer: Berlin/Heidelberg, Germany, 2005; pp. 19–46. CrossRef
Sharma, S.; Pandey, S.K. Revisiting Requirements Elicitation Techniques. Int. J. Comput. Appl. 2013, 75. CrossRef
Lim, S.; Henriksson, A.; Zdravkovic, J. Data-Driven Requirements Elicitation: A Systematic Literature Review. SN Comput. Sci. 2021, 2, 16. CrossRef
Tiwari, S.; Rathore, S.S. A Methodology for the Selection of Requirement Elicitation Techniques. arXiv 2017, arXiv:1709.08481.
Wong, L.R.; Mauricio, D.S.; Rodriguez, G.D. A Systematic Literature Review about Software Requirements Elicitation. J. Eng. Sci. Technol. 2017, 12, 296–317.
Sutcliffe, A.; Sawyer, P. Requirements Elicitation: Towards the Unknown Unknowns. In Proceedings of the 2013 21st IEEE International Requirements Engineering Conference (RE), Rio de Janeiro, Brazil, 15–19 July 2013; pp. 92–104.
Bühne, S.; Herrmann, A. Handbook Requirements Management. IREB International Requirements Engineering Board e.V. 2022. Available online: https://cpre.ireb.org/en/downloads-and-resources/downloads/category:handbooks (accessed on 27 October 2023).
Nuseibeh, B.; Easterbrook, S. Requirements Engineering: A Roadmap. In Proceedings of the Conference on the Future of Software Engineering-ICSE’00, Limerick, Ireland, 4–11 June 2000; pp. 35–46.
Pacheco, C.; García, I.; Reyes, M. Requirements Elicitation Techniques: A Systematic Literature Review Based on the Maturity of the Techniques. IET Softw. 2018, 12, 365–378. CrossRef
Publications Office of the European Union. What Is Data Ownership, and Does It Still Matter under EU Data Law?: An Exploration of Traditional Concepts of Data Ownership, and of the Expected Impact of the Data Act; Publications Office: Luxembourg, 2024.
Paustian, S.; Köhlke, J.; Mattes, J.; Lehnhoff, S. Ready, Set, … Rollout?—The Role of Heterogeneous Actors and Proximities in the Delayed Smart Meter Rollout in Germany. Clean. Eng. Prod. 2025, 26, 100930. CrossRef
Cavoukian, A.; Polonetsky, J.; Wolf, C. SmartPrivacy for the Smart Grid: Embedding Privacy into the Design of Electricity Conservation. Identity Inf. Soc. 2010, 3, 275–294. CrossRef
Bundesnetzagentur. Intelligentes Messsystem. Available online: https://www.bundesnetzagentur.de/DE/Vportal/Energie/Metering/start.html (accessed on 6 November 2023).
Bundesministerium der Justiz. Messstellenbetriebsgesetz-MsbG Official Legal Text. Available online: https://www.gesetze-im-internet.de/messbg/ (accessed on 6 November 2023).
Cavanillas, J.M.; Curry, E.; Wahlster, W. The Big Data Value Opportunity. In New Horizons for a Data-Driven Economy; Springer: Cham, Switerland, 2016; pp. 3–11.
Froese, J.; Straub, S. Wem gehören die Daten?–Rechtliche Aspekte der digitalen Souveränität in der Wirtschaft. In Digitalisierung Souverän Gestalten; Hartmann, E.A., Ed.; Springer: Berlin/Heidelberg, Germany, 2021; pp. 86–97. CrossRef
GDPR. General Data Protection Regulation (GDPR)—Official Legal Text. 2016. Available online: https://gdpr-info.eu/ (accessed on 6 November 2023).
McHenry, M.P. Technical and Governance Considerations for Advanced Metering Infrastructure/Smart Meters: Technology, Security, Uncertainty, Costs, Benefits, and Risks. Energy Policy 2013, 59, 834–842. CrossRef
Molina-Markham, A.; Shenoy, P.; Fu, K.; Cecchet, E.; Irwin, D. Private Memoirs of a Smart Meter. In Proceedings of the 2nd ACM Workshop on Embedded Sensing Systems for Energy-Efficiency in Building-BuildSys ’10, Zurich, Switzerland, 2 November 2010; p. 61.
Ács, G.; Castelluccia, C. I Have a DREAM! (DiffeRentially privatE smArt Metering). In Information Hiding; Filler, T., Pevný, T., Craver, S., Ker, A., Eds.; Springer Berlin Heidelberg: Berlin, Heidelberg, 2011; Volume 6958, pp. 118–132. CrossRef
Wang, J.; Gao, F.; Zhou, Y.; Guo, Q.; Tan, C.W.; Song, J.; Wang, Y. Data Sharing in Energy Systems. Adv. Appl. Energy 2023, 10, 100132. CrossRef
Efthymiou, C.; Kalogridis, G. Smart Grid Privacy via Anonymization of Smart Metering Data. In Proceedings of the 2010 First IEEE International Conference on Smart Grid Communications, Gaithersburg, MD, USA, 4–6 October 2010; pp. 238–243. CrossRef
Chhachhi, S.; Teng, F. Market Value of Differentially-Private Smart Meter Data. In Proceedings of the 2021 IEEE Power & Energy Society Innovative Smart Grid Technologies Conference (ISGT), Washington, DC, USA, 16–18 February 2021; pp. 1–5.
Hassan, M.U.; Rehmani, M.H.; Chen, J. Differential Privacy Techniques for Cyber Physical Systems: A Survey. IEEE Commun. Surv. Tutor. 2019, 22, 746–789. CrossRef
Aitzhan, N.Z.; Svetinovic, D. Security and Privacy in Decentralized Energy Trading Through Multi-Signatures, Blockchain and Anonymous Messaging Streams. IEEE Trans. Dependable Secur. Comput. 2018, 15, 840–852. CrossRef
Winkel, C.; Schukat, S.; Heise, H. Importance and Feasibility of Animal Welfare Measures from a Consumer Perspective in Germany. Food Ethics 2020, 5, 21. CrossRef
Rohlmann, C.; Verhaagh, M.; Efken, J. Steckbriefe zur Tierhaltung in Deutschland: Ferkelerzeugung und Schweinemast; Johann Heinrich von Thünen-Institute: Braunschweig, Germany, 2021.
Weible, D.; Christoph-Schulz, I.; Salamon, P.; Zander, K. Citizens’ perception of modern pig production in Germany: A mixed-method research approach. Br. Food J. 2016, 118, 2014–2032. CrossRef
Bundesamt, S. Trend zu Großbetrieben in der Landwirtschaft-Schweinehaltung besonders betroffen. Pressemitteilung Nr. N 001. Available online: https://www.destatis.de/DE/Presse/Pressemitteilungen/2020/01/PD20_N001_413.html (accessed on 21 March 2025).
Bäurle, H.; Tamásy, C. Regionale Konzentrationen der Nutztierhaltung in Deutschland; Institut für Strukturforschung und Planung in agrarischen Intensivgebieten (ISPA): Vechta, Germany, 2012; Volume 79.
Federal Ministry of Food and Agriculture. African Swine Fever (ASF): Information on cases in Germany. Available online: https://www.bmel.de/EN/topics/animals/animal-health/african-swine-fever.html#:~:text=and%20awareness%20building-,Current%20situation%3A,boar%20population%20in%20the%20region (accessed on 21 March 2025).
Patel, D.; Brahmbhatt, M.; Bariya, A.; Nayak, J.; Singh, V. Blockchain technology in food safety and traceability concern to livestock products. Heliyon 2023, 9, e16526. CrossRef
Krampe, C.; Serratosa, J.; Niemi, J.K.; Ingenbleek, P.T.M. Consumer Perceptions of Precision Livestock Farming-A Qualitative Study in Three European Countries. Animals 2021, 11, 1221. CrossRef
Xu, X.; Weber, I.; Staples, M. Architecture for Blockchain Applications; Springer: Cham, Switerland, 2019.
Kampan, K.; Tsusaka, T.W.; Anal, A.K. Adoption of Blockchain Technology for Enhanced Traceability of Livestock-Based Products. Sustainability 2022, 14, 13148. CrossRef
Yuan, Y.; Liu, X.; Hong, K.; Song, S.; Gao, W. Trustworthy Traceability of Quality and Safety for Pig Supply Chain Based on Blockchain. In Cognitive Internet of Things: Frameworks, Tools and Applications; Lu, H., Ed.; Springer International Publishing: Cham, Switerland, 2020; pp. 343–355. CrossRef
Meister, J.; Lehnhoff, S.; Göring, A.; Altherr, T. Digitization of Measures Cascading for the System Safety of Power Grids by openKONSEQUENZ. In Proceedings of the 16th Symposium Energieinnovation, Graz, Austria, 12–14 February 2020.
Goering, A.; Meister, J.; Lehnhoff, S.; Herdt, P.; Jung, M.; Rohr, M. Reference architecture for open, maintainable and secure software for the operation of energy networks. CIRED-Open Access Proc. J. 2017, 2017, 1410–1413. CrossRef
Dam, T.; Klausner, L.D.; Neumaier, S.; Priebe, T. A Survey of Dataspace Connector Implementations. arXiv 2024, arXiv:2309.11282.
Solmaz, G.; Cirillo, F.; Fürst, J.; Jacobs, T.; Bauer, M.; Kovacs, E.; Santana, J.R.; Sánchez, L. Enabling data spaces: Existing developments and challenges. In Proceedings of the 1st International Workshop on Data Economy, Rome, Italy, 9 December 2022; pp. 42–48.
Leachu, S.; Janßen, J.; Gdanitz, N.; Kirchhöfer, M.; Janzen, S.; Stich, V. Cascading Scenario Technique Enabling Automated And Situation-based Crisis Management. In Proceedings of the 2023 Conference on Production Systems and Logistics: CPSL, Querétaro, Mexico, 28 February–2 March 2023; Herberger, D., Hübner, M., Stich, V., Eds.; publish-Ing.: Hannover, Germany, 2023; pp. 321–331.
Gottschalk, M.; Uslar, M.; Delfs, C. The Use Case and Smart Grid Architecture Model Approach: The IEC 62559-2 Use Case Template and the SGAM Applied in Various Domains; Springer: Berlin/Heidelberg, Germany, 2017.
Janzen, S.; Gdanitz, N.; Abdel Khaliq, L.; Munir, T.; Franzius, C.; Maass, W. Anticipating Energy-driven Crises in Process Industry by AI-based Scenario Planning. In Proceedings of the 56th Hawaii International Conference on System Sciences, Maui, HI, USA, 3–6 January 2023.
Putrama, I.M.; Martinek, P. Heterogeneous data integration: Challenges and opportunities. Data Brief 2024, 56, 110853.
Leachu, S.; Berninger, S.; Janßen, J. AI-Based Crisis Management Utilizing Scenarios. In Proceedings of the 23rd Working Conference on Virtual Enterprises: PRO-VE 2022, Lisbon, Portugal, 19–21 September 2022; Springer International Publishing: Cham, Switzerland, 2022.
Otto, B. The evolution of data spaces. In Designing Data Spaces: The Ecosystem Approach to Competitive Advantage; Springer International Publishing: Cham, Switzerland, 2022; pp. 3–15.
8 附录
表 1.智能电表:数据所有权特征。
姓名 | 描述 |
---|---|
数据权利 | GDPR 赋予最终消费者有关其智能电表数据的多项权利。这些权利包括访问权、更正权、被遗忘权和停止数据处理的权利。此外,GDPR 还授予控制者(例如我们案例中的 DSO)某些权利。这些权利包括收集、读取、写入、处理、分析和删除数据的能力。 |
数据占有与控制 | 智能电表数据的所有权和控制权归 DSO 所有,DSO 有权通过签订合同或法律协议将上述所有权和控制权转移给第三方。 |
数据责任 | DSO 对智能电表数据负有责任。这意味着 DSO 负有道德和法律义务,以监督智能电表数据的收集、存储、处理和使用,确保其准确性、安全性、隐私性并符合相关法规和标准。 |
授予权利 | 最终消费者是将智能电表数据权利授予 DSO 的人。但是,通过服务合同,他们赋予公用事业公司向第三方授予权利的权力。 |
表 2.智能电表:数据所有权要求。
姓名 | 描述 |
---|---|
法律方面 | 智能电表数据应按照 GDPR( https://gdpr-info.eu/issues/personal-data/ )(2025 年 2 月 3 日访问)和 MsbG( https://www.gesetze-im-internet.de/messbg/ )(2025 年 2 月 3 日访问)处理。DSO 必须在收集、处理或分析最终消费者的数据之前通过合同协议获得最终消费者的明确同意。DSO 应在共享智能电表数据之前与第三方建立合同协议。一旦不再需要用于预期目的,应根据法律要求删除或匿名化可与个人关联的智能电表数据。 |
道德方面 | DSO 应确保智能电表数据仅用于支持电网的运营,严格遵守适用的数据保护法规,并实施必要的数据隐私和安全保障措施。对智能电表数据的访问应限制在提供服务所需的最少信息量。 |
数据要求 | 智能电表数据应符合MsbG中概述的规范和指南,包括但不限于数据的格式、结构和内容,以及数据传输的协议和标准。 |
案例要求 | 在征求最终消费者同意时,应以通俗易懂的语言和方式提供有关将收集哪些数据以及出于何种目的的详细信息。最终消费者应该能够访问他们的智能电表数据,并且访问方式应该简单明了。可以链接到个人的智能电表数据应匿名或假名化。 |
技术要求 | 应保护智能电表数据免受未经授权的访问,包括实施适当的技术措施来保护数据,例如加密、访问控制和安全通信协议。数据保护措施应在设计和默认情况下实施。具体而言,数据保护措施应嵌入数据处理工作流程中,默认设置优先考虑安全性和隐私性,除非授权方以合法理由明确覆盖。 |
表 3. PLF:数据所有权特征。
姓名 | 描述 |
---|---|
数据权利 | SSI 系统中的利益相关者可以分配各种权利,例如时间序列保留时间的长度、限制不包含个人数据的数据发布以及删除链下数据。链上数据无法被随后删除或更改,但如果不分配,则毫无用处。 |
数据占有与控制 | 由于区块链的去中心化解决方案,数据处于网络所有参与者的控制之下。网络参与者本身拥有数据。去中心化存储解决方案将确保数据由每个参与者冗余存储,但只有所有者才能实际访问其数据。 |
数据责任 | 数据责任目前还不是重要的。 |
授予权利 | 农民可以使用去中心化身份自行决定要发布哪些数据。不存在具有扩展权限的上级实例,也不需要自行授予权限。 |
表 4. PLF:数据所有权要求。
姓名 | 描述 |
---|---|
法律方面 | 系统必须确保遵守适用于个人数据处理的《通用数据保护条例》(GDPR)要求。这包括但不限于确保从收集、处理到删除的数据隐私和保护,为数据主体提供访问、更正、删除或移植其数据的能力,在设计和默认情况下实施数据保护原则,以及维护处理活动的记录。 |
道德方面 | 生成的数据必须遵守有关数据处理、参与者隐私和透明度的道德标准。这涉及获得所有参与者的知情同意,确保匿名性和数据保护。应采取措施匿名化参与者数据并保护个人信息。 |
数据要求 | 该软件必须支持时间序列数据以及各种随附文件(包括兽医文件、资格和证书)的管理。这需要能够根据用户请求或系统要求存储、检索、更新和删除此类数据和文档。 |
案例要求 | 维护数据收集的法律基础和保护个人数据的具体步骤的记录。定义将合法获取的非个性化数据与个性化数据相结合的机制,优先考虑数据安全和消费者隐私。 |
技术要求 | PLF 数据必须存储在链下,以确保数据访问的可扩展性和效率。此外,必须保护数据流量(包括但不限于 MQTT 通信),以保障传输过程中数据的完整性和机密性。 |
表 5.能源数据空间:数据所有权特征。
姓名 | 描述 |
---|---|
数据权利 | 数据权利应考虑如下因素:处理危机情况所需数据的法律方面、GDPR以及DSO、TSO和客户之间的数据共享所有权。 |
数据占有与控制 | 部分数据由配电系统运营商 (DSO) 和输电系统运营商 (TSO) 拥有和控制。停电数据由 TSO 公开共享,DSO 收集、处理停电数据,然后将其传达给 TSO。 |
数据责任 | DSO 有责任收集停电数据,并将这些数据公开传达给 TSO(例如,每年)和客户(例如,按需求)。 |
授予权利 | 数据应由 DSO、TSO 和消费者共同拥有。然而,尚不清楚消费者究竟如何影响数据收集的必要性,因为部分数据是稳定电网和降低进一步停电风险所必需的。 |
表 6.能源数据空间:数据所有权要求。
姓名 | 描述 |
---|---|
法律方面 | 人们对如何以不违反《通用数据保护条例》(GDPR)的方式在技术上实现分析师实用数据(例如个人和非个人)的组合的理解仍然有限。 |
道德方面 | 应考虑多种道德考量。在中断期间,服务双方(提供商和消费者)对重要数据的访问都可能中断。此外,用户隐私需要谨慎处理和安全存储,以防止未经授权的访问或滥用。 |
数据要求 | 只要多方在交换数据,数据要求就应该符合DO概念。 |
案例要求 | 在大多数情况下,消费者同意提供其数据是法律规定的;但是,这些数据不是个性化的。因此,应包括特殊步骤,以便利用这两种类型的数据,无论是执法部门收集的数据(例如,用于计费目的)还是个性化数据(例如,特定地点发生的停电)。 |
技术要求 | 所涉及服务(例如服务提供商、数据消费者等)之间的数据交换应以安全的方式进行,并确保防止未经授权的访问。 |