MR中Hbase的Scan使用技巧

来源：懂视网责编：小采时间：2020-11-09 13:23:12

MR中Hbase的Scan使用技巧

MR中Hbase的Scan使用技巧:Hadoop的MR运算中，Hbase可以作为输入数据源参与运算，其中作为HTable的迭代器Scan有几个使用技巧涉及的方法如下： public void setBatch(int batch)public void setCaching(int caching)public void setCacheBlocks

推荐度：

点击下载本文 文档为doc格式

导读MR中Hbase的Scan使用技巧:Hadoop的MR运算中，Hbase可以作为输入数据源参与运算，其中作为HTable的迭代器Scan有几个使用技巧涉及的方法如下： public void setBatch(int batch)public void setCaching(int caching)public void setCacheBlocks

Hadoop的MR运算中，Hbase可以作为输入数据源参与运算，其中作为HTable的迭代器Scan有几个使用技巧涉及的方法如下： public void setBatch(int batch)public void setCaching(int caching)public void setCacheBlocks(boolean cacheBlocks) public void setB

Hadoop的MR运算中，Hbase可以作为输入数据源参与运算，其中作为HTable的迭代器Scan有几个使用技巧

涉及的方法如下：

public void setBatch(int batch)
public void setCaching(int caching)
public void setCacheBlocks(boolean cacheBlocks)

public void setBatch(int batch) ：

为设置获取记录的列个数，默认无限制，也就是返回所有的列

public void setCaching(int caching)：

每次从服务器端读取的行数，默认为配置文件中设置的值

public void setCacheBlocks(boolean cacheBlocks)：

为是否缓存块，默认缓存，我们分内存，缓存和磁盘，三种方式，一般数据的读取为内存->缓存->磁盘，当MR的时候为非热点数据，因此不需要缓存

因此在MR的时候最好设置如下：

scan.setCacheBlocks(false);
scan.setCaching(200);//大了占内存，但是rpc少
scan.setBatch(6);//你需要的列

已有 0 人发表留言，猛击->> 这里<<-参与讨论

ITeye推荐

—软件人才免语言低担保赴美带薪读研！—

IT 资讯

原文地址：MR中Hbase的Scan使用技巧, 感谢原作者分享。

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

MR中Hbase的Scan使用技巧

推荐度：

点击下载本文 文档为doc格式

标签：方法使用方法使用技巧

热门焦点

MR中Hbase的Scan使用技巧

MR中Hbase的Scan使用技巧

MR中Hbase的Scan使用技巧

最新推荐

猜你喜欢

热门推荐