首页 > 批处理修改文件内容的问题,使用awk命令

批处理修改文件内容的问题,使用awk命令

我这有个csv格式的数据文件,像这样:

id,iplong,agent,partnerid,cid,cntr,timeat,category,referer
3036123,700371228,Nokia_2626,8jljr,8ke8p,ng,2012-02-23 00:00:00.0,es,
3036121,3673743995,NokiaC2-00,8iqzc,8gspj,in,2012-02-23 00:00:00.0,es,365wsqn3c1s0ko4c
3036115,2885218125,MAUI,8icfe,8gt1j,vn,2012-02-23 00:00:00.0,co,
3036116,3033932966,Nokia_E63,8in1t,8g236,th,2012-02-23 00:00:00.0,pp,2yfyym3c5wis4o4w
......

第一行是字段名,第二行开始是数据,有些行referer字段是空不用理。

问题出在时间戳的格式上:2012-02-23 00:00:00.0

末尾多了个.0导致格式不对,怎样批处理去掉末尾两位呢?别人说用java或c++编程写,但是我已经忘光了写不出,同学说用awk命令可以,我看了awk命令但是还是不懂怎么删掉多余两位,用别的方法也行,求指教谢谢。


不会写awk,来一个perl的

#!/usr/bin/env perl

use utf8;
use strict;
use warnings;

foreach my $file (@ARGV) {
    open (my $fh, '<', $file) or die "Can not open file $file : $!";
    open (my $oh, '>', $file.".out")  or die "Can not open file $file.out : $!";

    while (my $line = <$fh>) {
        $line =~ s/(\d*-\d*-\d* \d*:\d*:\d*)\.\d/$1/;
        print $oh $line;
    }

    close $fh;
    close $oh;
}

来一个perl6的

#!/usr/bin/env perl6

use v6;
use MONKEY-SEE-NO-EVAL;

sub MAIN(Str :r(:$regex), Str :s(:$substr), Str :e(:$ext) = '.out', Int :i(:$ignore-line) = 0, *@files) {
    for @files -> $file {
        my $out = open $file ~ ".out", :w;

        for $file.IO.lines.kv -> $index, $line is copy {
            next if $index <= $ignore-line;
            $line ~~ EVAL "s/" ~ $regex ~ "/" ~ $substr ~ "/";
            $out.say: $line;
        }

        $out.close;
    }
}

用法

./script.p6 -r='(\d*\-\d*\-\d*\s\d*\:\d*\:\d*)\.\d' -s='$0' *files 

cat test.csv | awk -F','  '{ if (NR > 1) { split($7, arr, /\./); sub($7, arr[1], $0) }; print }'
【热门文章】
【热门文章】