个人笔记
  • 备忘
    • ava 进程占用 VIRT 虚拟内存超高的问题研究
    • Yarn 虚拟内存详解
    • python魔术方法
    • Python/WSGI应用快速入门
    • CDH下载
    • gdb100个小技巧

JAVA动态代理

tangzehang 大数据相关 五月 4, 2018

Hadoop里的RPC实现就是用动态代理实现的。 现在来看下一个简单的动态代理实现: package cn.b
Read More »

Hive数据倾斜

tangzehang 大数据相关 五月 3, 2018

Hive数据倾斜的表现就是任务处在99%或者100%,但是却没有结束(偶尔还在100%时出现OOM现象)。 原
Read More »

HBase热点问题

tangzehang 大数据相关 五月 3, 2018

HBase表会分成N个region进行存储(相当于分区),每个region都有start-end key。 默
Read More »

hadoop1,hadoop2区别

tangzehang 大数据相关 五月 3, 2018

1:HDFS的增强,hadoop1 namenode是单点问题,hadoop2水平扩展出standby的nam
Read More »

yarn程序执行流程

tangzehang 大数据相关 五月 3, 2018

1:客户端提交任务到RM 2:RM申请资源先执行程序的ApplicationMaster 3:Applicat
Read More »

1 … 4 5 6 … 10
分类目录
  • JAVA (4)
  • Python (6)
  • 一些小东西 (4)
  • 大数据相关 (19)
  • 机器学习 (1)
  • 系统 (12)
  • 踩过的坑 (12)

粤ICP备18039485号