黄石网站制作公司,国家公示企业信息查询官网,时尚女装网站模版,怎样获得做网站的客户1. 长数据是什么鬼#xff1f;之前介绍了如何将多个性状的箱线图放在一个图上#xff0c;比如learnasreml包中的fm数据#xff0c;它有h1~h5五年的株高数据#xff0c;想对它进行作图。「数据预览#xff1a;」 library(learnasreml) data(fm) head(fm) Tree… 1. 长数据是什么鬼之前介绍了如何将多个性状的箱线图放在一个图上比如learnasreml包中的fm数据它有h1~h5五年的株高数据想对它进行作图。「数据预览」 library(learnasreml) data(fm) head(fm) TreeID Spacing Rep Fam Plot dj dm wd h1 h2 h3 h4 h51 80001 3 1 70048 1 0.334 0.405 0.358 29 130 239 420 6302 80002 3 1 70048 2 0.348 0.393 0.365 24 107 242 410 6003 80004 3 1 70048 4 0.354 0.429 0.379 19 82 180 300 5004 80005 3 1 70017 1 0.335 0.408 0.363 46 168 301 510 7005 80008 3 1 70017 4 0.322 0.372 0.332 33 135 271 470 6706 80026 3 1 70002 2 0.359 0.450 0.392 30 132 258 390 570这里相对h1,h2,h3,h4,h5这五个性状进行作图我们可以将其转化为「长数据」问题来了什么是「长数据」什么是「宽数据」(不是短数据这不是反义词谢谢)「宽数据」❝即变量是多列数据每一列都是一个值比如株高数据第一年的株高是一列第二年的株高是一列第三年的株高是一列这些数据就是宽数据。❞ID2018height2019height2020heighttID001121418ID002111419ID003141516「长数据」❝即变量是数据都在一列比如株高数据第一列是ID第二列是年份第三列是株高这种数据叫长数据。❞ID年份株高ID001201812ID001201914ID001202018ID002201811ID002201914ID002202019ID003201814ID003201915ID003202016「tidyverse」系列包喜欢长数据无论是清洗数据还是汇总统计还是ggplot2可视化都喜欢长数据。❝飞哥注我今天明白了这个道理即tidyverse系列喜欢长数据感觉打开了任督二脉对于数据处理又有了新的理解。❞2. 怎么转化为长数据我知道三种方法reshape2的melt函数现在还知道这个包的人R龄应该在5年以上了反正我一直都用很好用但是被作者嫌弃了现在被很多人嫌弃了……data.table的metlt函数和reshape2包的函数同名用法也相似可以对DT数据处理很快。现在我用melt函数时就不用载入reshape2了直接用data.table包就行tidyverse中的tidyr中的pivot_longer函数这个更简单用过这个函数再也没有迷路过。因为melt函数语法比较复杂经常需要查看帮助文档或者以前的笔记。看一下最简单的方法吧看一下数据 dd fm[,c(1,9:13)] head(dd) TreeID h1 h2 h3 h4 h51 80001 29 130 239 420 6302 80002 24 107 242 410 6003 80004 19 82 180 300 5004 80005 46 168 301 510 7005 80008 33 135 271 470 6706 80026 30 132 258 390 570然后用pivot_longer函数将其转化为长数据 re dd %% pivot_longer(.,-1,names_to Year,values_to Height) head(re)# A tibble: 6 x 3 TreeID Year Height 1 80001 h1 292 80001 h2 1303 80001 h3 2394 80001 h4 4205 80001 h5 6306 80002 h1 24代码解释我用了管道符%/%将数据传递给pivot_longer第二个-1意思是除了第一个不处理其它都处理也可以用2:6表示第二到第六列处理第三个names_to是变量的名称这里定义为Year第四个values_to是保存的性状名这里是Height可以看到长数据有3列分别是TreeIDYearHeight3. ggplot2作图怎么搞之前我使用ggplot2作图时想做什么图就在网上copy代码然后根据自己的数据名称修改代码然后运行代码。一次性代码用过就忘半吊子水平一直很稳定。当我知道了ggplot2用长数据之后又是另一种理解library(ggplot2)re %% ggplot(.,aes(x Year, y Height, colour Year)) geom_boxplot()先看图片成功了图片比较满意第一个是h1的株高第二个是h2的株高依次类推。但是代码是什么意思呢我看了ggplot2的入门画图分为三个部分数据在哪里re是数据x轴y轴在哪里x轴是Yeary轴是Height画什么类型的图这里是箱线图所以是geom_boxplot「如果是画分组散点图」re %% ggplot(.,aes(x Year, y Height, colour Year)) geom_point()「如果是画分组分散的散点图」re %% ggplot(.,aes(x Year, y Height, colour Year)) geom_jitter()4. 所以散点图和箱线图结合呢直接用连接就行了感觉到了画家作图的快乐算是丫丫学徒吧哈哈re %% ggplot(.,aes(x Year, y Height, colour Year)) geom_jitter() geom_boxplot()5. 感受所以这就是学习的快乐了!R语言进阶笔记1 | 深挖一门语言的必要性