延吉市住房城乡建设局官方网站,网站源代码生成网站,高端网咖宣传语,滨州做网站建设价格数据链接#xff1a;https://www.microsoft.com/en-us/download/details.aspx?id52367
1 数据基本信息
1.1 数据介绍
182名用户在超过三年的时间内#xff08;从2007年4月到2012年8月#xff09;在#xff08;微软亚洲研究院#xff09;Geolife项目中收集的。该数据集…数据链接https://www.microsoft.com/en-us/download/details.aspx?id52367
1 数据基本信息
1.1 数据介绍
182名用户在超过三年的时间内从2007年4月到2012年8月在微软亚洲研究院Geolife项目中收集的。该数据集的GPS轨迹由一系列带有时间戳的点组成每个点都包含纬度、经度和海拔的信息数据集包含17,621条轨迹总距离大约为120万公里总持续时间为50,176小时这些轨迹是由不同的GPS记录仪和GPS手机记录的并且具有各种不同的采样率91%的轨迹是以密集的表示方式记录的例如每15秒或每510米记录一个点 该数据集记录了用户广泛的户外活动包括不仅是日常生活例行公事如回家和上班还有一些娱乐和运动活动如购物、观光、用餐、徒步和骑自行车
1.2 数据的分布
尽管这个数据集在中国的30多个城市以及美国和欧洲的一些城市中有广泛的分布但大部分数据是在中国北京生成的。图1显示了这个数据集在北京的分布热图。热条右侧的数字表示在某一位置生成的点数。 1.3 轨迹的距离和持续时间
轨迹的距离和持续时间的分布分别在图2和图3中呈现。 1.4 每个用户GPS数据数量
在数据收集程序中部分用户携带GPS记录仪达数年之久而其他一些用户仅有几周的轨迹数据集。这个分布在图4中呈现而每个用户收集的轨迹数量的分布则在图5中显示。 2 数据新颖的地方——出行方式
73名用户已经用交通方式给他们的轨迹贴上了标签如驾驶、乘坐公交车、骑自行车和步行。虽然这仅涵盖了数据集的一部分但规模仍然可以支持出行方式的学习。 3 数据格式
3.1 轨迹数据 3.2 通行方式label 出行方式有walk , bike , bus , car , subway, train , airplane , boat , run and motorcycle . 4 数据形式
一共182个文件夹每个代表一个用户的所有轨迹 每个PLT文件包含一个单独的轨迹并以其开始时间命名。为了避免时区可能造成的混淆我们在每个点的日期/时间属性中使用了格林威治标准时间GMT