旅游网站设计论文（Arxiv网络科学论文摘要16篇）

带重启的随机游走的通用多层网络探索;量子创业生态系统的景观;量化仇恨社区如何激化在线用户;通过时间衰减线图直接嵌入时间网络边;COVID-19 大流行和美国远程办公的未来;MLPInit：使用 MLP 初始化实现令人尴尬的简单 GNN 训练加速;通过可视化超链接连通性来解释网站可靠性;符号网络上多主题信念动态的持续振荡;城市洪水期间扰动交通网络的剖析;分析公共议会数据的开放框架;使用时间知识图谱通过发表影响表示的引文轨迹预测;多层网络的认知建模：洞察力、进步和未来挑战;CBLab：具有丰富数据支持的可扩展交通仿真;专利数据中的城市经济适应性和复杂性;基于人类移动数据量化 COVID-19 传播风险：一种用于有效接触者追踪的个性化 PageRank 方法;使用平台 crumbs 进行数据科学：对 YouTube 上的虚假浏览量的调查;带重启的随机游走的通用多层网络探索原文标题： Universal Multilayer Network Exploration by Random Walk with Restart地址： http://arxiv.org/abs/2107.04565作者： Anthony Baptista, Aitor Gonzalez, Anaïs Baudot摘要：几年来，数据的数量和种类都在急剧增加。这些数据通常表示为网络，然后用网络理论提出的方法进行探索。近年来见证了网络探索方法的扩展，以利用更复杂和更丰富的网络框架。例如，随机游走已扩展到探索多层网络。然而，当前的随机游走方法在它们可以处理的网络层的组合和异质性方面受到限制。需要新的分析和数值随机游走方法来应对多层网络日益增加的多样性和复杂性。我们在这里提出 MultiXrank，这是一个 Python 包，它可以在任何类型的多层网络上以优化的实现方式启用随机游走和重启 (RWR)。该软件包由 RWR 的通用数学公式支持。我们使用留一法交叉验证和链路预测评估了 MultiXrank，并引入了协议来衡量添加或删除多层网络数据对预测性能的影响。我们通过对参数空间的深入探索，进一步测量了 MultiXrank 对输入参数的敏感性。最后，我们用人类遗传疾病背景下的无监督节点优先级和监督分类的不同用例来说明 MultiXrank 的多功能性。量子创业生态系统的景观原文标题： The Landscape of the Quantum Start-up Ecosystem地址： http://arxiv.org/abs/2205.01999作者： Zeki Can Seskir, Ramis Korkmaz, Arsev Umur Aydinoglu摘要：自 2000 年代初以来，第二次量子革命一直在产生突破性的科技成果；然而，关于这场革命对行业，特别是对初创企业的影响的科学文献是有限的。在本文中，我们提出了一项景观研究，其中收集了来自 42 个国家的 441 家公司的数据集，这些公司被我们认定为量子初创企业，这意味着它们主要将量子技术 (QT) 作为其首要优先业务。我们回答以下问题：（1）量子初创企业的时间和地理分布是什么？ (2) 我们如何对它们进行分类，这些类别是如何填充的？ (3) 我们可以从趋势的经验数据中得出任何模式吗？我们发现，这些公司中有超过 92% 是在过去 10 年内成立的，其中超过 50% 位于美国、英国和加拿大。我们将 QT 初创企业分为六个领域：（i）互补技术，（ii）量子计算（硬件），（iii）量子计算（软件/应用程序/模拟），（iv）量子密码学/通信，（v）量子传感和计量，以及 (vi) 支持公司，并针对国家和时间分析了每个领域的人口。最后，我们认为，一个国家的低水平量子创业活动可能是随后采取的国家举措的一个指标，随后会看到初创企业数量的增加和不同地区活动的多样化。 QT 字段。量化仇恨社区如何激化在线用户原文标题： Quantifying How Hateful Communities Radicalize Online Users地址： http://arxiv.org/abs/2209.08697作者： Matheus Schmitz, Keith Burghardt, Goran Muric摘要：虽然在线社交媒体提供了一种让被忽视或压制的声音被听到的方式，但它也为用户提供了一个传播仇恨言论的平台。这种言论通常起源于边社区，但也可能蔓延到主流渠道。在本文中，我们根据传播到社会网络其他部分的仇恨言论来衡量加入边仇恨社区的影响。我们利用 Reddit 的数据来评估加入一种回声室的效果：一个由志同道合的用户组成的数字社区，他们表现出仇恨行为。我们衡量成员在成为积极参与者之前和之后在所研究社区之外使用仇恨言论的情况。使用中断时间序列 (ITS) 分析作为因果推理方法，我们衡量溢出效应，其中来自某个社区内的仇恨语言可以通过使用社区外仇恨词的使用水平作为主体传播到该社区之外学习仇恨。我们调查了四个不同的 Reddit 子社区 (subreddits)，涵盖了仇恨言论的三个领域：种族主义、厌女症和羞辱脂肪。在所有这三种情况下，我们发现发起社区之外的仇恨言论有所增加，这意味着加入此类社区会导致仇恨言论在整个平台上传播。此外，发现用户在最初加入社区后的几个月内都会接受这种新的仇恨言论。我们表明，有害言论不会保留在社区内。我们的研究结果提供了回声室有害影响的新证据，以及缓和它们以减少采用仇恨言论的潜在好处。通过时间衰减线图直接嵌入时间网络边原文标题： Direct Embedding of Temporal Network Edges via Time-Decayed Line Graphs地址： http://arxiv.org/abs/2210.00032作者： Sudhanshu Chanpuriya, Ryan A. Rossi, Sungchul Kim, Tong Yu, Jane Hoffswell, Nedim Lipka, Shunan Guo, Cameron Musco摘要：时间网络对涉及实体之间的定时交互的各种重要现象进行建模。用于时间网络上的机器学习的现有方法通常至少表现出两个限制之一。首先，假设时间是离散的，所以如果时间数据是连续的，用户必须确定离散化并丢弃精确的时间信息。其次，边表示只能从节点间接计算，这对于边分类等任务可能不是最优的。我们提出了一种避免这两个缺点的简单方法：构建网络的折线图，其中包括每个交互的节点，并根据交互之间的时间差对该图的边进行加权。从这个派生的图中，可以使用有效的经典方法计算原始网络的边表示。这种方法的简单性有助于明确的理论分析：我们可以建设性地展示我们的方法表示对于时间网络的自然合成模型的有效性。现实世界网络的经验结果证明了我们的方法在边分类和时间链路预测方面的有效性和效率。COVID-19 大流行和美国远程办公的未来原文标题： The COVID-19 Pandemic and the Future of Telecommuting in the United States地址： http://arxiv.org/abs/2210.00067作者： Deborah Salon, Laura Mirtich, Matthew Wigginton Bhagat-Conway, Adam Costello, Ehsan Rahimi, Abolfazl (Kouros) Mohammadian, Rishabh Singh Chauhan, Sybil Derrible, Denise da Silva Baker, Ram M. Pendyala摘要：这项研究的重点是美国 COVID-19 大流行与交通相关的重要长期影响：远程办公的增加。通过分析一项针对成年人的全国代表性小组调查，我们发现 40-50% 的工人希望在大流行后每月至少进行几次远程办公，而在 COVID 之前这一比例为 24%。如果可以选择，在大流行期间首次远程办公的人中有 90-95% 计划定期继续这种做法。我们还发现，新的远程办公人员在人口统计上与 COVID 之前的远程办公人员相似。 COVID 前后、更高的教育程度和收入以及某些工作类别在很大程度上决定了工人是否可以选择远程办公。尽管远程办公有所增长，但大约一半的员工预计仍无法远程办公，2/3 至 3/4 的员工预计他们在大流行后的远程办公模式与 COVID 之前的模式没有变化。这限制了远程办公对减少高峰时段交通需求的贡献。MLPInit：使用 MLP 初始化实现令人尴尬的简单 GNN 训练加速原文标题： MLPInit: Embarrassingly Simple GNN Training Acceleration with MLP Initialization地址： http://arxiv.org/abs/2210.00102作者： Xiaotian Han, Tong Zhao, Yozen Liu, Xia Hu, Neil Shah摘要：在大型图上训练图神经网络 (GNN) 非常复杂且非常耗时。这归因于稀疏矩阵乘法引起的开销，在训练仅具有节点特征的多层感知器 (MLP) 时会回避这些开销。 MLP 通过忽略图上下文，对于图数据来说更简单、更快，但是它们通常会牺牲预测精度，从而限制了它们在图数据中的应用。我们观察到，对于大多数基于消息传递的 GNN，我们可以简单地推导出一个模拟 MLP（我们称之为 PeerMLP），其权重可以相同，这让我们好奇 GNN 使用来自经过充分训练的 PeerMLP 的权重如何执行？令人惊讶的是，我们发现用这种权重初始化的 GNN 在图数据方面的性能明显优于其 PeerMLP，这促使我们使用 PeerMLP 训练作为 GNN 训练的初始化步骤。为此，我们提出了一种非常简单但非常有效的 GNN 训练加速初始化方法，称为 MLPInit。我们在具有不同 GNN 架构的多个大规模图数据集上进行的大量实验验证了 MLPInit 可以加速 GNN 的训练（在 OGB 产品上加速高达 33 倍）并经常提高预测性能（例如，GraphSAGE 在 7用于节点分类的数据集，以及在 4 个数据集上对度量 Hits@10 进行链路预测的改进高达 17.81%）。最重要的是，MLPInit 实现起来极其简单，可以灵活地用作基于消息传递的 GNN 的即插即用初始化方法。通过可视化超链接连通性来解释网站可靠性原文标题： Explaining Website Reliability by Visualizing Hyperlink Connectivity地址： http://arxiv.org/abs/2210.00160作者： Seongmin Lee, Sadia Afroz, Haekyu Park, Zijie J. Wang, Omar Shaikh, Vibhor Sehgal, Ankit Peshin, Duen Horng Chau摘要：随着 Internet 上的信息呈指数级增长，理解和评估网站的可靠性变得越来越重要。错误信息具有广泛的影响，从对媒体播下不信任的种子到破坏民主选举。虽然一些研究调查了如何提醒人们注意网络上的错误信息，但很少有研究解释网站如何参与传播虚假信息。为了填补研究空白，我们展示了 MisVis，这是一种基于 Web 的交互式可视化工具，可帮助用户通过理解网站如何参与在万维网上传播虚假信息来评估网站的可靠性。 MisVis 将网站的超链接连接可视化，并总结了提及该网站的 Twitter 帐户的关键特征。一项有 139 名参与者的大规模用户研究表明，MisVis 有助于用户评估和理解网络上的虚假信息，并且节点链接图可用于与非专家进行交流。 MisVis 可在公共演示链接上获得：https://poloclub.github.io/MisVis。符号网络上多主题信念动态的持续振荡原文标题： Sustained oscillations in multi-topic belief dynamics over signed networks地址： http://arxiv.org/abs/2210.00353作者： Anastasia Bizyaeva, Alessio Franci, Naomi Ehrich Leonard摘要：我们研究了具有共享信念系统的主体网络中多个相互关联的主题的信念形成动态。我们建立了充分条件和必要条件，在这些条件下，信念的持续振荡在 Hopf 分岔中出现在网络上，并描述了通信图和信念系统图在形成振荡的相对相位和幅度模式中的作用。城市洪水期间扰动交通网络的剖析原文标题： Anatomy of Perturbed Traffic Networks during Urban Flooding地址： http://arxiv.org/abs/2210.00403作者： Akhil Anil Rajput, Sanjay Nayak, Shangjia Dong, Ali Mostafavi摘要：城市洪水扰乱了交通网络，影响了流动性并扰乱了居民的出行。由于气候变化预计洪水事件会增加，并且考虑到交通网络的重要性，理解洪水造成的交通网络中断对于改善应急计划和城市复原力至关重要。利用来自重大洪水事件的高分辨率交通网络数据和先进的高阶网络分析，本研究揭示了扰动交通网络的解剖特征。首先，调查结果显示，在洪水退去后，整个网络持续增加的旅行时间可能会持续数周，即使在适度的洪水失败之后也是如此。在灾害事件期间，1.3% 路段的适度洪水导致整个交通网络的时间扩展 8%。结果还表明，长途旅行的旅行时间将增加更大的百分比。此外，旅行时间的增加程度不会随着与淹没区域的距离而衰减，这表明洪水影响的空间范围超出了淹没区域。现有文献主要介绍道路网络对洪水的物理脆弱性，本研究的结果从旅行时间和交通网络几何形状方面对洪水对交通网络功能的影响提供了重要的新颖理解。整个网络的持续旅行时间增加会在用户成本、额外的二氧化碳排放和生产力损失方面转化为重大的社会和经济影响。由于交通网络对城市运营的重要性，研究结果对城市管理者、交通规划者和应急管理者应对城市洪水的影响具有重要意义。分析公共议会数据的开放框架原文标题： Open Framework for Analyzing Public Parliaments Data地址： http://arxiv.org/abs/2210.00433作者： Shai Berkovitz, Amit Mazuz, Michael Fire摘要：政府组织的信息公开是所有关心政府职能的公民都应该感兴趣的主题。大规模开放的政府数据为公民和研究人员提供了新的机会来监控政府的活动并提高其透明度。多年来，各种项目和系统一直在使用开放的政府信息处理和分析政府数据。在这里，我们介绍了收集和分析议会数据 (CAPD) 框架。这种新颖的通用开放框架能够收集和分析来自多个来源的大规模公共政府数据。我们使用该框架收集了来自三个国家的 90 多个委员会的 64,000 多个议会协议。然后，我们解析收集的数据并从中计算结构化特征。接下来，使用计算出的特征，我们利用异常检测和时间序列分析来揭示对委员会活动的各种见解。我们证明，CAPD 框架可用于识别异常会议并检测影响议会功能的事件日期，并帮助监控其活动。使用时间知识图谱通过发表影响表示的引文轨迹预测原文标题： Citation Trajectory Prediction via Publication Influence Representation Using Temporal Knowledge Graph地址： http://arxiv.org/abs/2210.00450作者： Chang Zong, Yueting Zhuang, Weiming Lu, Jian Shao, Siliang Tang摘要：预测出版物对科技的影响已成为一个重要的研究领域，在技术投资、研究方向选择和技术决策等各种现实世界场景中都有用。引文轨迹预测是该领域最受欢迎的任务之一。现有方法主要依赖于从学术文章中挖掘时间和图数据。最近的一些方法能够通过聚合新出版物的元数据特征来处理冷启动预测。然而，导致引用的隐含因素以及处理时间和属性特征的更丰富的信息仍然需要探索。在本文中，我们提出了 CTPIR，这是一种新的引用轨迹预测框架，能够使用其所有属性的历史信息来表示新出版物或现有出版物的影响（引用动量）。我们的框架由三个模块组成：差异保留图嵌入、细粒度影响表示和基于学习的轨迹计算。为了测试我们的框架在更多情况下的有效性，我们从现实世界中收集并构建了一个新的时间知识图谱数据集，名为 AIPatent，它源于人工智能领域的全球专利。在 APS 学术数据集和我们贡献的 AIPatent 数据集上进行了实验。结果证明了我们的方法在引用轨迹预测任务中的优势。多层网络的认知建模：洞察力、进步和未来挑战原文标题： Cognitive modelling with multilayer networks: Insights, advancements and future challenges地址： http://arxiv.org/abs/2210.00500作者： Massimo Stella, Salvatore Citraro, Giulio Rossetti, Daniele Marinazzo, Yoed N. Kenett, Michael S. Vitevitch摘要：心理词典是一个复杂的认知系统，表示有关人们所知道的单词/概念的信息。数十年的心理学实验表明，跨多个交互认知水平的概念关联可以极大地影响单词的获取、存储和处理。如何在一个连贯的数学框架内映射语义、语音、句法和其他类型的概念关联，以研究心理词典的工作原理？我们在这里回顾认知多层网络作为研究心理词典的有前途的定量和解释框架。认知多层网络可以一次映射多种类型的信息，从而捕捉不同层次的关联如何在心理词典中共存并影响认知处理。这篇评论首先对多层网络的结构和形式进行了温和的介绍。然后，我们讨论了在单层网络中无法观察到的心理现象的定量机制，这些机制只能通过组合多层词典来揭示：（i）多重可行性突出了健康和临床人群中知识处理的语言核心和促进作用； (ii) 多层社区检测能够根据心理语言特征重建上下文意义； (iii) 层次分析可以调解中介、抑制和促进词汇访问的潜在相互作用。通过概述多层网络可以揭示认知知识表示的新颖定量视角，以及在下一代大脑/思维模型中，我们讨论了前沿未来研究的关键限制和有希望的方向。CBLab：具有丰富数据支持的可扩展交通仿真原文标题： CBLab: Scalable Traffic Simulation with Enriched Data Supporting地址： http://arxiv.org/abs/2210.00896作者： Chumeng Liang, Zherui Huang, Yicheng Liu, Zhanyu Liu, Guanjie Zheng, Hanyuan Shi, Yuhao Du, Fuliang Li, Zhenhui Li摘要：交通仿真为优化交通策略提供交互数据。然而，现有的交通模拟器由于缺乏可扩展性和输入数据不足而受到限制，这使得它们无法在真实的大规模城市路网场景中从交通模拟中生成交互式数据。在本文中，我们介绍了 City Brain Lab，这是一个可扩展的交通模拟工具包。 CBLab 由三个组件组成：CBEngine、CBData 和 CBScenario。 CBEngine 是一个支持大规模交通模拟的高效模拟器。 CBData 包括一个交通数据集，其中包含全球 100 个城市的道路网络数据。我们还开发了一个管道，以进行从原始道路网络到我们的交通模拟输入数据的一键式转换。结合 CBEngine 和 CBData，研究人员可以在真实大城市的道路网络中运行可扩展的交通模拟。在此基础上，CBScenario 分别为两种交通策略场景实现了交互环境和几种基线方法，可以训练和调优适应大规模城市交通的交通策略。据我们所知，CBLab 是第一个支持大规模城市场景交通策略优化的基础设施。代码在 Github 上可用：https://github.com/CityBrainLab/CityBrainLab.git。专利数据中的城市经济适应性和复杂性原文标题： Urban Economic Fitness and Complexity from Patent Data地址： http://arxiv.org/abs/2210.01001作者： Matteo Straccamore, Matteo Bruno, Bernardo Monechi, Vittorio Loreto摘要：多年来，关于注册专利的广泛数据集的日益普及使研究人员能够更好地理解技术创新驱动因素。在这项工作中，我们研究了专利的技术内容如何表征大都市地区的发展，以及创新与人均 GDP 的关系。利用从 1980 年到 2014 年的全球数据，并通过仅使用专利信息的基于网络的技术，我们确定了连贯的、不同的大都市地区群体，无论是聚集在同一地理区域还是从经济角度来看相似。我们还将一致多样化的概念扩展到专利生产，展示它如何代表大都市地区经济增长的决定性因素。这些结果证实了技术创新可以引领和引导城市经济发展的图景，从而开启了采用此处介绍的工具来研究城市发展与技术创新之间相互作用的可能性。基于人类移动数据量化 COVID-19 传播风险：一种用于有效接触者追踪的个性化 PageRank 方法原文标题： Quantifying COVID-19 transmission risks based on human mobility data: A personalized PageRank approach for efficient contact-tracing地址： http://arxiv.org/abs/2210.01005作者： Jiali Zhou, Zhan Zhao, Jiangping Zhou摘要：鉴于其广泛而持久的影响，COVID-19，尤其是其空间传播动力学受到了广泛关注。理解这种动态有助于公共卫生专业人员和城市管理者设计和部署有效的接触者追踪和治疗措施。然而，现有的大多数研究都集中在总体流动性流动上，很少利用广泛可用的分解级人类流动性数据。在本文中，我们提出了一种个性化 PageRank (PPR) 方法，以基于人员和位置的二分网络来估计 COVID-19 传播风险。该方法结合了个人的移动模式及其时空交互。为了验证所提出方法的适用性和相关性，我们研究了 COVID-19 病例的传播与基于智能交通的小型合成网络和来自中国香港的现实世界移动网络中的城市内移动模式之间的相互作用卡数据。我们基于各种大规模追踪和测试策略，包括基于 PPR、基于 PageRank (PR)、基于位置、路由- 基于和基本情况（无策略）。结果表明，基于 PPR 的方法实现了最高的效率、准确性和与实际案例数的 Spearmans 相关系数。这证明了 PPR 对传播风险估计的价值，以及结合个人移动模式对有效接触者追踪和测试的重要性。使用平台 crumbs 进行数据科学：对 YouTube 上的虚假浏览量的调查原文标题： Doing data science with platforms crumbs: an investigation into fakes views on YouTube地址： http://arxiv.org/abs/2210.01096作者： Maria Castaldo, Paolo Frasca, Tommaso Venturini, Floriana Gargiulo摘要：本文有助于正在进行的关于社交媒体数据的学术访问的讨论，讨论了一个尽管这种访问被禁止的案例，尽管它对于理解和打击在线虚假信息具有价值，尽管没有隐私或版权问题。我们的研究涉及 YouTube 的参与度指标，更具体地说，是该平台删除“虚假视图”（即平台认为是虚假或非法的视图）的方式。通过从一千个法国 YouTube 频道中提取的一年半数据，我们展示了这种现象的严重程度，它涉及我们语料库中的绝大多数频道和超过一半的视频。我们的分析表明，大多数假新闻在视频生命周期的后期得到纠正，并且视频的最终观看次数并不独立于他们收到的假观看次数。我们讨论了纠正延迟可能对内容传播产生的潜在危害：通过夸大观看次数，非法观看可能会使视频看起来比实际更受欢迎，并无端鼓励其人工和算法推荐。不幸的是，我们无法对这种现象提供明确的评估，因为 YouTube 在其 API 或界面中没有提供有关虚假视图的信息。因此，本文还呼吁 YouTube 和其他在线平台提高对可能对在线公共辩论质量产生重要影响的信息的透明度。声明：Arxiv文章摘要版权归论文原作者所有，机器翻译后由本人进行校正整理，未经同意请勿随意转载。本系列在公众号“网络科学研究速递”（netsci）和个人博客进行同步更新。

相关文章