海量公交数据的人群画像算法 |
| |
作者姓名: | 张锦 张建忠 汪飞 郭芊 |
| |
作者单位: | 湖南师范大学信息科学与工程学院,湖南长沙 410006;长沙理工大学计算机与通信工程学院,湖南长沙 410114;湖南师范大学信息科学与工程学院,湖南长沙 410006;湖南师范大学 数学与统计学院,湖南 长沙 410006 |
| |
基金项目: | 国家部委基金资助项目(31511010105);湖南省自然科学基金资助项目(2021JJ30456) |
| |
摘 要: | 面向海量公交数据的人群画像对分析城市群体出行特点、交通态势等极具价值,但对数据的处理存在耗时高、质量低、解释难等问题。提出一种海量公交数据人群画像的系统化解决策略,基于PageRank算法筛选出经过重要站点的人群轨迹,极大减少目标人群的轨迹数据;提出轨迹文本化分析方法来提高人群画像的可解释性;分析确定基于余弦距离的K-means算法作为人群画像分类的聚类算法。该算法在3 000万乘客公交出行数据上的实验表明:提出的解决策略能够较为系统性地解决海量公交数据的人群画像问题,同时基于余弦距离的K-means算法的聚类效果最好且准确率约达80%。将人群画像及其轨迹使用Flow Map进行可视化展示,结果符合真实世界的人群行为特征。
|
关 键 词: | 人群画像 PageRank算法 轨迹文本化 文本聚类 |
收稿时间: | 2021-02-26 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《国防科技大学学报》浏览原始摘要信息 |
|
点击此处可从《国防科技大学学报》下载免费的PDF全文 |
|