李苦李 发布的文章

一、Spark专业术语定义1、Application:Spark应用程序指的是用户编写的Spark应用程序,包含了Driver功能代码和分布在集群中多个节点上运行的Executor代码。Spar...

什么是flumeflume是apache的一个数据收集框架。定义了一个数据流的模型。下面这张图hadoop业务开发流程图可以说明Flume的重要性:Flume是一个分布式、可靠、和高可用的海量日...

如何学好数据分析?这个一个比较大的命题,很难一两句话弄说的清楚。在这里,苦李就以一个这数据方面的从业者的身份来说一说我的学习方法,当然有一点要说的是每个人的思想、方法、工作经历、知识侧重点都是不...

业务场景:基于导出的功能上,要求一次性查询10w条数据。但是这个10w的开始值和结束值不固定(比如:startNum = 123; endNum = 100123;)难点一:dubbox时间超时...

21世纪,世界已经进入数据大爆炸的时代,大数据时代已经来临。从商业公司内部的各种管理和运营数据,到个人移动终端与消费电子产品的社会化数据,再到互联网产生的海量信息数据等,每天世界上产生的信息量正...

一、什么是Flume?Flume是由Cloudera软件公司提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,后与2009年被捐赠了apache软件基金会,为hadoop相关...

命令说明command + t新建标签command + w关闭标签command + 数字 command + 左右方向键切换标签command + enter切换全屏command + f查...

1、索引ElasticSearch将数据存储在一个或多个索引(index)中,这里的索引就像SQL领域的数据库,例如:MySQL里的一个database。ElasticSearch内部使用Apa...

1、什么是NUMA?NUMA(Non Uniform Memory Access Architecture)是一种用于多处理器的电脑记忆体设计,内存访问时间取决于处理器的内存位置。 在NUMA下...

1、常规操作Launch:创建instance。Start:启动instance。Reboot:soft reboot重启操作系统,整个过程中,instance依然处于运行状态。hard reb...

从毕业到现在,我的技术成长可分为三个阶段,这三个阶段恰好与我在的三家公司保持一致。阶段一,京东。京东是我的第一个东家,从11年6月毕业到14年2月从京东离职,约有两年半的时间。在这两年多的时间里...

最近,沟通绩效。轮到小Q,我说,这次你的考评是C(四档中的第三档,属于中等偏下的水准),跟自己的预期是否有出入?他说,差距很大,没有达到预期,以为最低应该是B。(声音很小)我说,说说这一年有哪些...

每个人都以为自己很特别,其实呢,我们就是别人眼中的普通人,也是现实概率中的普通人。总有些程序员觉得自己很特别,牛逼哄哄,看所有人的代码都是shit,殊不知,别人看你的代码连屎都不如。觉醒代表一个...

Mac自带的python默认是没有安装pip的,记录一种简单、快速安装pip的方法:curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py...

ElasticSearch默认不在CentOS Yum源里,不能直接使用yum安装,现做以下配置,方便使用yum直接安装ES。1、配置ElasticSearch Yum源执行命令vim /etc...

kazoo是一个Python库,旨在使得Python能够轻松、便捷的使用zookeeper。kazoo的安装使用pip安装kazoo:pip install kazoo因为kazoo使用纯pyt...

最近,忙。十点前下班已经是一种奢侈了。累点倒没什么,最主要的是没时间写文章。日记也好,技术文章也好,我希望一周最少能写三篇,这样随着时间的增长,让我的博客产生一些积累,积少成多,最终成为我个人的...