当前位置: 首页 > news >正文

论文笔记:ATime-Aware Trajectory Embedding Model for Next-Location Recommendation

Knowledge and Information Systems, 2018

1 intro

1.1 背景

  • 随着基于位置的社交网络(LBSNs),如Foursquare和Facebook Places的日益流行,大量用户签到数据变得可用
    • 这些大量签到数据的可用性带来了许多有用的应用,以提升基于位置服务的用户体验
    • 其中一个任务是新兴的下一个位置推荐
  • 下一个位置推荐根据用户过去的签到记录,预测可能访问的后续位置
    • 时间信息在这个任务中扮演了重要角色
      • 例如,如果访问时间是工作日的早晨,用户从“家”开始访问“地铁”,然后“办公室”(或工作地点)应该是对这位用户的合适推荐
      • 如果访问时间是周末,则应推荐放松的地点

1.2 现有的工作

  • 现有的下一个位置推荐研究主要基于马尔可夫链属性模型连续签到之间的序列转换模式。
    • 由于数据稀疏性和计算复杂性,序列转换限制于一阶转换,无法捕捉更长的序列上下文。
    • 更重要的是,推荐任务中缺乏对多种时间因素的全面和深入考虑。
  • 在现有研究中,用户偏好通常被视为静态的,这并不反映用户兴趣的演变特征
    • 例如,学生可能在学期期间更频繁地在大学签到,而在作为某公司夏季实习生时则更频繁地在工作场所签到
      • ——>她的签到行为在不同时间段内发生变化
  • 现有研究也忽略了周期性模式
    • 例如,在工作日,用户可能早上在办公室签到,晚上在家签到

1.3 下一位置推荐的挑战性

  • 首先,如上例所示,用户的签到行为会随时间改变
  • 其次,即使我们能够根据用户推导出访问模式(例如,周末“家”→“商店”→“午餐”→“商店”→“晚餐”),仍然很难推断出每个模式的确切位置
    • 因为多个候选位置可能适合
      • 晚餐的下一个位置应基于多种考虑生成,包括自己的偏好、之前访问过的地点和其他时间因素

1.4 论文思路

  • 提出了一个新颖的时间感知轨迹嵌入模型(TA-TEM)

2 轨迹观察

  • 如之前的论文所言,序列影响是轨迹数据中最重要的时间因素之一,即用户连续签到点之间存在马尔可夫链特性。
  • 论文研究实际轨迹数据上的另外两种时间因素。

2.1 数据集

  • 三个公共地理社交网络数据集,每个数据集包含一年的签到数据

仅报告Gowalla数据集的结果,其他两个数据集的观察结果类似

2.2  观察1:用户对签到的偏好会随着长时间周期(例如,一个月)的变化而变化

  • 直观地说,用户的兴趣可能会在一段时间后发生变化(例如,一个月),这可能导致不同时间段的访问行为不同
  • 给定一个用户u,论文通过计算两个连续时间周期中u访问的位置集合的Jaccard相似度的平均值来计算重叠比率值(ORV)。
    • 设置一个时间周期为一个月
      • 在上述等式中,L(u,i)是用户u在第i个月访问的位置集合
      • 选择签到记录最多的前1000名用户,然后计算这些用户的平均ORV
  • 平均ORV是0.035(±0.002)
  • ——>小的Jaccard相似性值表明,在连续两个月中用户的签到位置之间的重叠很少。
    • 换句话说,用户对签到行为的偏好在长时间周期内会发生变化

2.3 观察2:周期性签到模式显著

  • 直观地说,用户可能有一些规律的日常和周常活动,如中午吃饭和周末放松。
    • 因此,位置的生成很可能会受到相应时间信息的影响,如一天中的小时和一周中的天
  • 周常模式:
    • 将轨迹分成按天的多个间隔,然后将所有用户在第i个间隔访问的位置组合成一个位置集合L(i)【一个簇】
      • 计算这七个簇中两个位置集合的平均内部和外部相似性
      • 内部和外部表示位置集合来自同一个和不同的簇
      • 使用Jaccard系数来测量两个位置集合之间的相似性

  • 对角线条目的Jaccard系数显著高于非对角线条目
    • ——>在一周内同一时间索引生成的两个位置集合比不同时间索引的更相似 
  • 基于小时索引进行类似的分析,结果绘制在图2(b)中,发现用户轨迹显示出有趣的时间模式

3 方法

3.1 轨迹嵌入:基本模型

  • 类似于word2vec
  • 位置j,窗口大小2K的上下文嵌入:
  • 轨迹t的目标函数

3.2 整合用户偏好变化

  • 用户在签到时的偏好可能随时间变化(见观察1)
  • 为了建模这一因素,论文将签到分为若干个月份,并假设用户u在第m个月与一个独特的人格vum​相关联。
    • 这里使用“人格”一词是为了反映用户随时间变化的偏好。
    • 除了偏好变化外,还假设用户对位置有一个相对稳定的总体偏好,这有助于生成常去的地点,如工作场所和家

3.3 整合周期性模式

  • 周期性签到模式描绘了观察2中提到的每周和每日的移动模式
  • 当用户生成轨迹时,他的行为不仅受到自己的偏好影响,还受到周期性偏好的影响。
  • 设hj和dt分别为轨迹t中第j个位置的一天中的小时索引和一周中的天索引。形式上,我们有:

3.4 TA-TEM 模型

目标函数更新为:

位置lj的上下文嵌入为:

3.5 推荐位置排名

一旦所有嵌入向量都学习完成,我们按以下方式生成下一个位置推荐

  • 给定用户u的前K个签到1,2,…,K1和下一个时间戳sK+1​(对应于月份m、天d和小时h),使用以下函数来排名候选位置L:

4 实验

相关文章:

论文笔记:ATime-Aware Trajectory Embedding Model for Next-Location Recommendation

Knowledge and Information Systems, 2018 1 intro 1.1 背景 随着基于位置的社交网络(LBSNs),如Foursquare和Facebook Places的日益流行,大量用户签到数据变得可用 这些大量签到数据的可用性带来了许多有用的应用,以…...

深度学习之---迁移学习

目录 一、什么是迁移学习 二、为什么需要迁移学习? 1. 大数据与少标注的矛盾: 2. 大数据与弱计算的矛盾: 3. 普适化模型与个性化需求的矛盾: 4. 特定应用(如冷启动)的需求。 三、迁移学习的基本问题有…...

百度网盘限速解决办法

文章目录 开启P2P下载30秒会员下载体验一次性高速下载服务导入“百度网盘青春版”后下载注册新号参与活动 获取下载直链后使用磁力链接下载不是办法的办法无效、已失效方法免限速客户端、老版本客户端、永久会员下载体验试用客户端,或类似脚本、工具获取下载直链后多…...

银河麒麟系统项目部署

使用服务器信息 软件:VMware Workstation Pro 虚拟机:ubtun 内存:20G 虚拟机连接工具: MobaXterm Redis连接工具: RedisDesktopManager 镜像:F:\Kylin-Server-10-8.2-Release-Build09-20211104-X86_64…...

Stable Diffusion【应用篇】【艺术写真】:粘土风之后陶瓷风登场,来看看如何整合AI艺术写真吧

在国外的APP Remini引爆了粘土滤镜后,接着Remini又推出了瓷娃娃滤镜。相当粘土滤镜,个人更喜欢瓷娃娃滤镜,因为陶瓷工艺更符合东方艺术审美。 下面我们就来看看陶瓷特效在AI写真方面的应用。话不多说,我们直接开整。 关于粘土整…...

手机IP地址距离多远会变:解析移动设备的网络定位奥秘

在移动互联网时代,手机IP地址扮演着至关重要的角色,它不仅是我们访问网络的基础,还常常与网络定位、地理位置服务等相关联。那么,手机IP地址在距离多远时会发生变化呢?手机IP地址距离多远会变?下面跟着虎观…...

ChatGPT中文镜像网站分享

ChatGPT 是什么? ChatGPT 是 OpenAI 开发的一款基于生成预训练变换器(GPT)架构的大型语言模型。主要通过机器学习生成文本,能够执行包括问答、文章撰写、翻译等多种文本生成任务。截至 2023 年初,ChatGPT 的月活跃用户…...

碳化硅陶瓷膜良好的性能

碳化硅陶瓷膜是一种高性能的陶瓷材料,以其独特的物理和化学特性,在众多领域展现出了广泛的应用前景。以下是对碳化硅陶瓷膜的详细介绍: 一、基本特性 高强度与高温稳定性:碳化硅陶瓷膜是一种非晶态陶瓷材料,具有极高的…...

每日一题——Python实现PAT乙级1028 人口普查 Keyboard(举一反三+思想解读+逐步优化)六千字好文

一个认为一切根源都是“自己不够强”的INTJ 个人主页:用哲学编程-CSDN博客专栏:每日一题——举一反三Python编程学习Python内置函数 Python-3.12.0文档解读 目录 题目链接​编辑我的写法 专业点评 时间复杂度分析 空间复杂度分析 总结 我要更强…...

小程序 UI 风格,构建美妙视觉

小程序 UI 风格,构建美妙视觉...

使用Python在VMware虚拟机中模拟Ubuntu服务器搭建网站

在此之前可以先使用VS Code连接到虚拟机:Visual Studio Code连接VMware虚拟机-CSDN博客 安装Web服务器Apache sudo apt-get install apache2 在个别情况下需要对Apache服务器的配置文件进行调整: 打开etc路径下的apache2文件夹,根据端口…...

腾讯测试开发<ieg 实验室>

3.26 40min 自我介绍实习经历有无遇到什么难点,你是如何克服的在这个项目中你大概做了多少个测试用例,这么多测试用例你平时用什么工具进行管理的,每一次跑全部还是每次只跑一部分现在假设给你一个新的项目,需要你这边去做测试&a…...

windows命令帮助大全

有关某个命令的详细信息,请键入 HELP 命令名 ASSOC 显示或修改文件扩展名关联。 ATTRIB 显示或更改文件属性。 BREAK 设置或清除扩展式 CTRLC 检查。 BCDEDIT 设置启动数据库中的属性以控制启动加载。 CACLS 显示或修改文件的访问控制列表(ACL)。 CALL 从另一个批处…...

pytest中失败用例重跑

pip install pytest-rerunfailures 下载rerunfailures插件包 配置文件中加入命令 --reruns 次数 也可在命令行中pytest --rerun-failures2 可以在allure报告中看到重试效果...

http穿透怎么做?

众所周知http协议的默认端口是80,由于国家工信部要求,域名必须备案才给开放80端口,而备案需要固定公网IP,这就使得开放http80端口的费用成本和时间成本变的很高。那么能不能利用内网穿透技术做http穿透呢?下面我就给大…...

前端技术回顾系列 11|TS 中一些实用概念

在微信中阅读,关注公众号:CodeFit。 创作不易,如果你觉得这篇文章对您有帮助,请不要忘了 点赞、分享 和 关注 我的公众号:CodeFit,为我的持续创作提供动力。 上文回顾:泛型在类和接口中的应用 上一篇文章我们回顾了 泛型 在 类 和 接口 中的应用。 通过使用泛型,我们…...

leetcode LRU 缓存

leetcode: LRU 缓存 LRU 全称为 Least Recently Used,最近最少使用,常常用于缓存机制,比如 cpu 的 cache 缓存,使用了 LRU 算法。LRU 用于缓存机制时,关键的是当缓存满的时候有新数据需要加载到缓存的,这个…...

LeetCode 2786.访问数组中的位置使分数最大:奇偶分开记录(逻辑还算清晰的题解)

【LetMeFly】2786.访问数组中的位置使分数最大:奇偶分开记录(逻辑还算清晰的题解) 力扣题目链接:https://leetcode.cn/problems/visit-array-positions-to-maximize-score/ 给你一个下标从 0 开始的整数数组 nums 和一个正整数 …...

嵌入式仪器模块:音频综测仪和自动化测试软件

• 24 位分辨率 • 192 KHz 采样率 • 支持多种模拟/数字音频信号的输入/输出 应用场景 • 音频信号分析:幅值、频率、占空比、THD、THDN 等指标 • 模拟音频测试:耳机、麦克风、扬声器测试,串扰测试 • 数字音频测试:平板电…...

计算商场折扣 、 判断体重指数 题目

题目 JAVA5 计算商场折扣分析:代码: JAVA6 判断体重指数分析:代码:大佬代码: JAVA5 计算商场折扣 描述 牛牛商场促销活动: 满100全额打9折; 满500全额打8折; 满2000全额打7折&…...

Coolapk-UWP 深度解析:基于MVVM架构的Windows桌面酷安客户端开发实战指南

Coolapk-UWP 深度解析:基于MVVM架构的Windows桌面酷安客户端开发实战指南 【免费下载链接】Coolapk-UWP 一个基于 UWP 平台的第三方酷安客户端 项目地址: https://gitcode.com/gh_mirrors/co/Coolapk-UWP 在移动应用生态日益丰富的今天,将移动端优…...

Postal邮件服务器与AI助手集成:MCP协议实现与安全实践

1. 项目概述:一个连接Postal与MCP的桥梁最近在折腾一些自动化工作流和智能体应用时,遇到了一个挺有意思的需求:如何让我那些基于Claude或GPT的AI助手,能够直接、安全地访问和操作我自建的邮件服务器数据?比如查询特定邮…...

LLM资源库:大语言模型开发者的高效导航与实战指南

1. 项目概述:一个汇聚LLM资源的“藏宝图”在人工智能,特别是大语言模型(LLM)领域,技术迭代的速度快得让人眼花缭乱。每天都有新的模型发布、新的工具开源、新的论文发表。对于开发者、研究者甚至是刚入门的学习者来说&…...

深入RISC-V链接脚本:从.lds文件看C程序的内存‘出生’与‘搬家’全过程

深入RISC-V链接脚本:从.lds文件看C程序的内存‘出生’与‘搬家’全过程 在嵌入式开发的世界里,一个C程序从源代码到最终在硬件上运行,经历了编译、链接和加载三个关键阶段。这个过程就像一个人的生命历程:编译是"出生"&…...

aitextgen与GPT-2-simple对比:为什么aitextgen是更好的选择

aitextgen与GPT-2-simple对比:为什么aitextgen是更好的选择 【免费下载链接】aitextgen A robust Python tool for text-based AI training and generation using GPT-2. 项目地址: https://gitcode.com/gh_mirrors/ai/aitextgen aitextgen是一个强大的Pytho…...

从零构建安全配置管理系统:告别.env硬编码,拥抱分层加载与密钥安全

1. 项目概述与核心价值最近在整理一个老项目的代码库,发现里面充斥着各种硬编码的配置、散落在各处的API密钥,以及不同环境(开发、测试、生产)下互相冲突的数据库连接字符串。每次部署新环境,都得像寻宝一样&#xff0…...

开源基础大模型实战:从零构建领域专家模型的技术指南

1. 项目概述:从零到一,理解开源基础大模型的价值最近在社区里看到不少朋友在讨论“datawhalechina/base-llm”这个项目,乍一看名字,可能觉得又是一个平平无奇的模型仓库。但如果你真的动手去部署、去尝试、去理解它背后的设计&…...

亿图脑图高级技能:从思维建模到生产力提升的完整指南

1. 项目概述与核心价值最近在整理个人知识库和项目文档时,我一直在寻找一个能让我思维更清晰、协作更高效的“大脑外挂”。市面上思维导图工具不少,但要么功能臃肿、学习曲线陡峭,要么过于轻量、难以应对复杂的结构化思考。直到我深度体验并拆…...

从Excel到数据库:用Pandas Timestamp统一你的时间数据(pd.to_datetime实战解析)

从Excel到数据库:用Pandas Timestamp统一你的时间数据(pd.to_datetime实战解析) 在数据工程领域,时间数据的标准化处理往往是ETL流程中最容易被低估的痛点。当Excel表格中的"2023/1/15"遇上数据库里的"15-JAN-23&q…...

Polymarket预测市场模拟交易工具:零风险学习链上金融衍生品

1. 项目概述与核心价值最近在研究链上预测市场,发现一个挺有意思的开源项目:jchimbor/polymarket-paper-trader。简单来说,这是一个针对Polymarket预测市场的“模拟交易”或“纸面交易”工具。Polymarket本身是一个基于Polygon链的去中心化预…...