【问题标题】:Read text file from position in Java从Java中的位置读取文本文件
【发布时间】:2012-04-11 08:48:13
【问题描述】:

我需要从具有指定字符集的 OFFSET 的文本文件中读取 char[](大小为 COUNT)。 COUNT 和 OFFSET 是字符,而不是字节。 他是我的代码:

raf = new RandomAccessFile(filePath, "r");      
if ((mBuffer == null) || (mBuffer.length < count)) {
    mBuffer = new byte[(int)(count/mDecoder.averageCharsPerByte())];
    mByteWrap = ByteBuffer.wrap(mBuffer);
    mCharBuffer = new char[count];
    mCharWrap = CharBuffer.wrap(mCharBuffer);
}
try {
    offset = (int)(offset/mDecoder.averageCharsPerByte());
    count = (int)(count/mDecoder.averageCharsPerByte());
    raf.seek(offset);
    raf.read(mBuffer,0,count);
    mByteWrap.position(0);
    mCharWrap.position(0);
    mDecoder.decode(mByteWrap, mCharWrap, true);
} catch (IOException e) {
    return null;
}
return mCharBuffer;

有没有更简单的方法? (无需手动匹配 char->byte)

我在寻找 java.util.Scanner,但它是 Iterator 风格的,我需要随机访问风格。

PS数据不应该被复制多次

【问题讨论】:

    标签: java text io


    【解决方案1】:

    使用 BufferedReader 的skip() 方法。 在你的情况下:

    BufferedReader reader = new BufferedReader(new FileReader(filePath));
    reader.skip(n); // chars to skip
    // .. and here you can start reading
    

    如果你想指定一个特定的编码,你可以使用

    InputStream is = new FileInputStream(filePath);
    BufferedReader reader = new BufferedReader(new InputStreamReader(is,"UTF-8"));
    reader.skip(n); // chars to skip
    // .. and here you can start reading
    

    【讨论】:

    • 我想 BufferedReader 在阅读时使用默认系统字符集? skip() 是如何工作的(它只是移动文件指针还是读取 n 个字符)?
    • 我以指定字符集的方式添加到答案中。
    • 如果我首先需要 100-200 个字符,然后是 50-100 个?
    • 字符长度不固定的字符集编码很复杂。因为您必须从头开始或从可以确定新字符开始的点开始。但是您可以尝试使用mark()reset(),并立即标记位置0。
    • 我说的是定位阅读器。我找到了 void reset()。谢谢,dash1e!
    【解决方案2】:

    你可以使用 BufferedInputStream 的 read(byte[] b, int off, int len)

    这里的off是偏移量(从你想开始阅读的地方开始)

    http://docs.oracle.com/javase/7/docs/api/java/io/BufferedInputStream.html#read%28byte[],%20int,%20int%29

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-09-26
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多