大数据工程师

本文介绍了大数据开发所需的专业技能,包括熟悉Java、Python语言、标准SQL、Hadoop/Hive等平台,以及MapReduce、Spark、Storm等技术。还概述了大数据开发者的职责范围,如组件二次开发、工具开发、数据采集清洗、数据仓库开发等。

大数据职位要求:

熟悉java python语言 标准SQL语言
使用过开源hadoop/hive分布式大数据处理平台,熟悉mapReduce/spark开发框架
熟练掌握storm或spark流计算开发技术,熟悉hbase数据库


大数据开发所需要的能力:

硬件OS网络数据库的基础知识
大数据平台和组件涉及范围广,各种都需要懂一点,对写出正确的,高质量的代码非常有用。

语言开发能力
最少需要熟练掌握java和Hive及SQL,如果需要用Spark,还需要掌握Scala。


大数据组件知识
设计思想,适用范围,底层架构,常用命令,API或语句的用法,常见问题调试方法,这一部分真正决定了一个人的水平高低。



大数据开发的工作职责:
宏观层面上来说,大数据开发和传统的软件开发人员的工作性质没有多大差别,都需要参与需求分析,概要设计,详细设计,编码,测试,交付,维护等多方面的工作。


组件二次开发:
组件的功能或性能不能满足要求,或存在已知bug,需要打补丁
对能力的要求很高

组件工具开发: 
一些组件只能通过命令行操作,一些组件需要自定义统计或监控,需要开发相应的工具
对能力的要求较高

数据采集和清洗开发:
类似传统数据仓库ETL的工作,以及实时性更高的数据采集
配置类和开发类工作并存

数据仓库开发:
类似传统数据仓库的开发,以SQL为主,辅以调度等周边系统开发工作
对SQL,OLAP技能有较高要求

离线数据应用开发:
基于HDFS或Hadoop上数据仓库开发离线应用,如报表,离线推荐等
计算框架是MapReduce

在线数据应用开发:
基于高速存储,消息队列等开发在线应用,如BI,搜索,在线推荐等
计算框架是Spark或Storm




人工智能及机器学习和大数据开发的关系:

大数据技术可以看做是实现人工智能,机器学习应用的一种手段


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值