优化代码

a7c76f3f · DeleMing · aa4ae227 · a7c76f3f · a7c76f3f · a7c76f3f
Commit a7c76f3f authored Jun 30, 2020 by DeleMing
12 changed files
--- a/src/main/java/com/zorkdata/tools/avro/AvroDeserializer.java
+++ b/src/main/java/com/zorkdata/tools/avro/AvroDeserializer.java
@@ -16,24 +16,22 @@ import org.slf4j.LoggerFactory;
 * @author DeleMing
 */
 public class AvroDeserializer {
-    private static final Logger LOGGER = LoggerFactory.getLogger(AvroDeserializer.class);
+    private static final Logger logger = LoggerFactory.getLogger(AvroDeserializer.class);
    public JSONObject jsonObject;
    public JSONArray jsonArray;
    public Schema schema;
    public String[] keys;

    public AvroDeserializer(String schema) {
-        getKeysFromjson(schema);
+        getKeysFromJson(schema);
    }

    /**
-     * @param schema：Avro序列化所使用的schema
-     * @return void    返回类型
-     * @throws
-     * @Title: getKeysFromjson
-     * @Description:用于获取Avro的keys
+     * 用于获取Avro的keys
+     *
+     * @param schema Avro序列化所使用的schema
     */
-    void getKeysFromjson(String schema) {
+    void getKeysFromJson(String schema) {
        this.jsonObject = JSONObject.parseObject(schema);
        this.schema = new Schema.Parser().parse(schema);
        this.jsonArray = this.jsonObject.getJSONArray("fields");
@@ -44,14 +42,11 @@ public class AvroDeserializer {
    }

    /**
-     * @param body    参数：byte[] body：kafka消息。
-     * @param @return 设定文件
-     * @return String    返回类型
-     * @throws
-     * @Title: deserializing
-     * @Description: 用于Avro的反序列化。
+     * 用于Avro的反序列化
+     *
+     * @param body 参数：byte[] body：kafka消息。
+     * @return GenericRecord
     */
-
    public GenericRecord deserializing(byte[] body) {
        DatumReader<GenericData.Record> datumReader = new GenericDatumReader<GenericData.Record>(this.schema);
        Decoder decoder = DecoderFactory.get().binaryDecoder(body, null);
@@ -59,7 +54,7 @@ public class AvroDeserializer {
        try {
            result = datumReader.read(null, decoder);
        } catch (Exception e) {
-            LOGGER.error(String.format("error Avro反序列化"), e);
+            logger.error("error Avro反序列化", e);
        }
        return result;
    }

--- a/src/main/java/com/zorkdata/tools/avro/AvroDeserializerFactory.java
+++ b/src/main/java/com/zorkdata/tools/avro/AvroDeserializerFactory.java
@@ -4,6 +4,7 @@ package com.zorkdata.tools.avro;
 * @author DeleMing
 */
 public class AvroDeserializerFactory {
+
    private static AvroDeserializer logs = null;

    private static AvroDeserializer metrics = null;

--- a/src/main/java/com/zorkdata/tools/avro/AvroSerializer.java
+++ b/src/main/java/com/zorkdata/tools/avro/AvroSerializer.java
@@ -24,46 +24,41 @@ public class AvroSerializer {
    public JSONObject jsonObject;
    public JSONArray jsonArray;
    public Schema schema;
-    public List<String> filedsArrayList = new ArrayList<String>();
+    public List<String> fieldsArrayList = new ArrayList<String>();

    public AvroSerializer(String schema) {
-        getKeysFromjson(schema);
+        getKeysFromJson(schema);
    }

    /**
-     * @param schema
-     *            ：Avro序列化所使用的schema
-     * @return void 返回类型
-     * @throws
-     * @Title: getKeysFromjson
-     * @Description:用于获取Avro的keys
+     * 用于获取Avro的keys
+     *
+     * @param schema Avro序列化所使用的schema
     */
-    void getKeysFromjson(String schema) {
+    void getKeysFromJson(String schema) {
        this.jsonObject = JSONObject.parseObject(schema);
        this.schema = new Schema.Parser().parse(schema);
        this.jsonArray = this.jsonObject.getJSONArray("fields");
-        if (filedsArrayList != null && filedsArrayList.size() > 0) {
-            filedsArrayList.clear();
+        if (fieldsArrayList != null && fieldsArrayList.size() > 0) {
+            fieldsArrayList.clear();
        }
        for (int i = 0; i < this.jsonArray.size(); i++) {
-            filedsArrayList.add(this.jsonArray.getJSONObject(i).get("name").toString());
+            fieldsArrayList.add(this.jsonArray.getJSONObject(i).get("name").toString());
        }
    }

    /**
-     * @param
-     * @param @return 设定文件
-     * @return String 返回类型
-     * @throws
-     * @Title: serializing
-     * @Description: 用于Avro的序列化。
+     * 用于Avro的序列化
+     *
+     * @param temtuple
+     * @return
     */
    private synchronized byte[] serializing(List<String> temtuple) {
        byte[] returnstr = null;
        GenericRecord datum = new GenericData.Record(this.schema);
        // 将数据加到datum中
-        for (int i = 0; i < filedsArrayList.size(); i++) {
-            datum.put(filedsArrayList.get(i), temtuple.get(i));
+        for (int i = 0; i < fieldsArrayList.size(); i++) {
+            datum.put(fieldsArrayList.get(i), temtuple.get(i));
        }
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        // DatumWriter 将数据对象翻译成Encoder对象可以理解的类型
@@ -76,7 +71,7 @@ public class AvroSerializer {
            encoder.flush();

        } catch (IOException e) {
-            System.out.println("序列化失败 " + e );
+            System.out.println("序列化失败 " + e);
        } finally {
            if (out != null) {
                try {
@@ -105,8 +100,8 @@ public class AvroSerializer {
        JSONObject jsonObject = (JSONObject) JSONObject.parse(json);// new TypeReference<Object>() {}
        GenericRecord datum = new GenericData.Record(this.schema);
        // 将数据加到datum中
-        for (int i = 0; i < filedsArrayList.size(); i++) {
-            datum.put(filedsArrayList.get(i), new Utf8(String.valueOf(jsonObject.get(filedsArrayList.get(i)))));
+        for (int i = 0; i < fieldsArrayList.size(); i++) {
+            datum.put(fieldsArrayList.get(i), new Utf8(String.valueOf(jsonObject.get(fieldsArrayList.get(i)))));
        }
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        // DatumWriter 将数据对象翻译成Encoder对象可以理解的类型
@@ -146,8 +141,8 @@ public class AvroSerializer {
        byte[] returnstr = null;
        GenericRecord datum = new GenericData.Record(this.schema);
        // 将数据加到datum中
-        for (int i = 0; i < filedsArrayList.size(); i++) {
-            datum.put(filedsArrayList.get(i), jsonObject.get(filedsArrayList.get(i)));
+        for (int i = 0; i < fieldsArrayList.size(); i++) {
+            datum.put(fieldsArrayList.get(i), jsonObject.get(fieldsArrayList.get(i)));
        }
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        // DatumWriter 将数据对象翻译成Encoder对象可以理解的类型
@@ -249,8 +244,8 @@ public class AvroSerializer {
        byte[] returnstr = null;
        GenericRecord datum = new GenericData.Record(this.schema);
        // 将数据加到datum中
-        for (int i = 0; i < filedsArrayList.size(); i++) {
-            datum.put(filedsArrayList.get(i), new Utf8(String.valueOf(genericRecord.get(key[i]))));
+        for (int i = 0; i < fieldsArrayList.size(); i++) {
+            datum.put(fieldsArrayList.get(i), new Utf8(String.valueOf(genericRecord.get(key[i]))));
        }
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        // DatumWriter 将数据对象翻译成Encoder对象可以理解的类型

--- a/src/main/java/com/zorkdata/tools/avro/AvroSerializerFactory.java
+++ b/src/main/java/com/zorkdata/tools/avro/AvroSerializerFactory.java
@@ -4,6 +4,7 @@ package com.zorkdata.tools.avro;
 * @author DeleMing
 */
 public class AvroSerializerFactory {
+
    private static AvroSerializer metricMetadata = null;
    private static AvroSerializer logMetadata = null;


--- a/src/main/java/com/zorkdata/tools/kafka/CommonProducer.java
+++ b/src/main/java/com/zorkdata/tools/kafka/CommonProducer.java
@@ -3,6 +3,8 @@ package com.zorkdata.tools.kafka;
 import com.zorkdata.tools.oldkafka.AvroSerializerFactory;
 import org.apache.kafka.clients.producer.KafkaProducer;
 import org.apache.kafka.clients.producer.ProducerRecord;
+import org.slf4j.Logger;
+import org.slf4j.LoggerFactory;

 import java.util.Map;
 import java.util.Properties;
@@ -13,87 +15,90 @@ import java.util.Properties;
 */
 public class CommonProducer {

-    private static String kafkaServer;
-    private static int kafkaBathSize;
+    private static final Logger logger = LoggerFactory.getLogger(CommonProducer.class);

-    private static KafkaProducer<String, byte[]> producerByte;
-    private static KafkaProducer<String, String> producerString;
+    private String kafkaServer;
+    private int kafkaBathSize;
+
+    private KafkaProducer<String, byte[]> producerByte;
+    private KafkaProducer<String, String> producerString;
+
+    public void initConfig() {
+        kafkaServer = Config.INSTANCE.getKafkaServers();
+        kafkaBathSize = Config.INSTANCE.getKafkaBathSize();
+    }

    public CommonProducer() {
        try {
            initConfig();
            Properties props = new Properties();
            props.put("bootstrap.servers", kafkaServer);
-            props.put("client.id", "webAPI4LogGather");
+
+            // 不自定义clientid使用自增clientid， props.put("client.id", "webAPI4LogGather");
            props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
            props.put("value.serializer", "org.apache.kafka.common.serialization.ByteArraySerializer");
            props.put("batch.size", kafkaBathSize);
            // 启用压缩
            props.put("compression.type", "lz4");
-            producerByte = new KafkaProducer<String, byte[]>(props);
+            producerByte = new KafkaProducer<>(props);
            props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
-            producerString = new KafkaProducer<String, String>(props);
+            producerString = new KafkaProducer<>(props);
        } catch (Exception ex) {
-            ex.printStackTrace();
+            logger.error(ex.toString());
        }
    }

-    public void initConfig() {
-        kafkaServer = Config.getInstance().kafkaServers;
-        kafkaBathSize = Config.getInstance().kafkaBathSize;
-    }
-
    public void sendLog(String topic, String logTypeName, String timestamp, String source, String offset,
                        Map<String, String> dimensions, Map<String, Double> metrics, Map<String, String> normalFields) {
        try {
            byte[] bytes = AvroSerializerFactory.getLogAvorSerializer().serializingLog(logTypeName, timestamp, source,
                    offset, dimensions, metrics, normalFields);
-            producerByte.send(new ProducerRecord<String, byte[]>(topic, null, bytes));
+            producerByte.send(new ProducerRecord<>(topic, null, bytes));
        } catch (Exception e) {
-            e.printStackTrace();
+            logger.error(e.toString());
        }
    }

    public void sendLog(String topic, String logJson) {
        try {
-            producerString.send(new ProducerRecord<String, String>(topic, null, logJson));
+            producerString.send(new ProducerRecord<>(topic, null, logJson));
        } catch (Exception e) {
-            e.printStackTrace();
+            logger.error(e.toString());
        }
    }

-    public void sendErrorLog(String errorLogTopic, String logJson) {
+    public void sendMetric(String metricTopic, String metricSetName, String timestamp, Map<String, String> dimensions,
+                           Map<String, Double> metrics) {
        try {
-            producerString.send(new ProducerRecord<String, String>(errorLogTopic, null, logJson));
+            byte[] bytes = AvroSerializerFactory.getMetricAvorSerializer().serializingMetric(metricSetName, timestamp,
+                    dimensions, metrics);
+            producerByte.send(new ProducerRecord<>(metricTopic, null, bytes));
        } catch (Exception e) {
-            e.printStackTrace();
+            logger.error(e.toString());
        }
    }

-    public void sendErrorMetric(String errorMetricTopic, String logJson) {
+    public void sendErrorLog(String errorLogTopic, String logJson) {
        try {
-            producerString.send(new ProducerRecord<String, String>(errorMetricTopic, null, logJson));
+            producerString.send(new ProducerRecord<>(errorLogTopic, null, logJson));
        } catch (Exception e) {
-            e.printStackTrace();
+            logger.error(e.toString());
        }
    }

-    public void sendAlarm(String alarmTopic, String alarmJson) {
+    public void sendErrorMetric(String errorMetricTopic, String logJson) {
        try {
-            producerString.send(new ProducerRecord<String, String>(alarmTopic, null, alarmJson));
+            producerString.send(new ProducerRecord<>(errorMetricTopic, null, logJson));
        } catch (Exception e) {
-            e.printStackTrace();
+            logger.error(e.toString());
        }
    }

-    public void sendMetric(String metricTopic, String metricSetName, String timestamp, Map<String, String> dimensions,
-                           Map<String, Double> metrics) {
+    public void sendAlarm(String alarmTopic, String alarmJson) {
        try {
-            byte[] bytes = AvroSerializerFactory.getMetricAvorSerializer().serializingMetric(metricSetName, timestamp,
-                    dimensions, metrics);
-           producerByte.send(new ProducerRecord<String, byte[]>(metricTopic, null, bytes));
+            producerString.send(new ProducerRecord<>(alarmTopic, null, alarmJson));
        } catch (Exception e) {
-            e.printStackTrace();
+            logger.error(e.toString());
        }
    }


--- a/src/main/java/com/zorkdata/tools/kafka/CommonProducerPool.java
+++ b/src/main/java/com/zorkdata/tools/kafka/CommonProducerPool.java
@@ -32,7 +32,6 @@ public class CommonProducerPool implements Closeable {
        init();
    }

-
    public void init() {
        pool = new CommonProducer[threadNum];
        for (int i = 0; i < threadNum; i++) {
@@ -41,7 +40,8 @@ public class CommonProducerPool implements Closeable {
    }

    public CommonProducer getProducer() {
-        if (index > 65535) {
+        final int maxThread = 65535;
+        if (index > maxThread) {
            index = 0;
        }
        return pool[index++ % threadNum];

--- a/src/main/java/com/zorkdata/tools/kafka/Config.java
+++ b/src/main/java/com/zorkdata/tools/kafka/Config.java
 package com.zorkdata.tools.kafka;

 import com.zorkdata.tools.utils.PropertiesUtil;
+import lombok.Getter;
+import org.slf4j.Logger;
+import org.slf4j.LoggerFactory;

 import java.util.Properties;

 /**
 * @author MSI-Gaming
 */
+@Getter
 public class Config {
-    private static Config instance;

-    public static Config getInstance() {
-        if (instance == null) {
-            instance = new Config();
-        }
-        return instance;
-    }
+    private static final Logger logger = LoggerFactory.getLogger(Config.class);

-    public String kafkaServers;
-    public int kafkaBathSize;
-    public String topicName;
+    private String kafkaServers;
+    protected int kafkaBathSize;
+    protected String topicName;

+    public static final Config INSTANCE = new Config();

+    /**
+     * 读取配置文件
+     */
    private Config() {
        try {
            Properties properties = PropertiesUtil.getProperties("/config.properties");
@@ -29,7 +31,7 @@ public class Config {
            kafkaBathSize = Integer.parseInt(properties.getProperty("kafka.batch.size"));
            topicName = properties.getProperty("kafka.topic.name");
        } catch (Exception e) {
-            e.printStackTrace();
+            logger.error(e.toString());
            System.exit(1);
        }
    }

--- a/src/main/java/com/zorkdata/tools/kafka/Kafka.md
+++ b/src/main/java/com/zorkdata/tools/kafka/Kafka.md
+# Kafka Producer部分参数设置及其说明
+```.java
+Properties props = new Properties();
+
+props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, "hadoop:9092");
+
+/**
+ * 这个参数控制着相同分区内数据发送的批次个数大小，也就是当数据达到 这个size 时，进行数据发送,
+ * 但是并不是数据达不到 size 的值，就不会发送数据，默认是 1048576，即 16k
+ */
+props.put(ProducerConfig.BATCH_SIZE_CONFIG, 16384);
+
+/**
+ * 消息是否发送，不是仅仅通过 batch.size 的值来控制的，实际上是一种权衡策略，即吞吐量和延时之间的权衡
+ * linger.ms 参数就是控制消息发送延时行为的，默认是 0，表示消息需要被立即发送。
+ */
+props.put(ProducerConfig.LINGER_MS_CONFIG, 1);
+
+/**
+ * 指定了producer 端用于缓存的缓存区大小，单位是字节，默认是 33554432, 即 32G
+ */
+props.put(ProducerConfig.BUFFER_MEMORY_CONFIG, 33554432);
+
+/**
+ * 用户控制 生产者的持久性 acks 有3个值，
+ *  0: 表示producer 完全不理睬 broker 的处理结果
+ *  all： 表示发送数据时，broker 不仅会将消息写入到本地磁盘，同时也要保证其他副本也写入完成，才返回结果
+ *  1: 表示发送数据时，broker 接收到消息写入到本地磁盘即可，无需保证其他副本是否写入成功
+ */
+props.put(ProducerConfig.ACKS_CONFIG, "1");
+
+props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringSerializer");
+props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringSerializer");
+return props;
+```
+        
\ No newline at end of file
--- a/src/main/java/com/zorkdata/tools/load/Test.java
+++ b/src/main/java/com/zorkdata/tools/load/Test.java
+package com.zorkdata.tools.load;
+
+import com.zorkdata.tools.kafka.Config;
+
+/**
+ * @author: LiaoMingtao
+ * @date: 2020/6/30
+ */
+public class Test {
+
+    public static void main(String[] args) {
+        System.out.println(Config.INSTANCE.getKafkaServers());
+    }
+}
--- a/src/main/java/com/zorkdata/tools/mock/MockGrok.java
+++ b/src/main/java/com/zorkdata/tools/mock/MockGrok.java
@@ -3,18 +3,9 @@ package com.zorkdata.tools.mock;
 import com.alibaba.fastjson.JSONObject;
 import com.zorkdata.tools.kafka.CommonProducer;
 import com.zorkdata.tools.kafka.CommonProducerPool;
-import com.zorkdata.tools.oldkafka.Producer;
-import com.zorkdata.tools.oldkafka.ProducerPool;
-import org.apache.kafka.clients.producer.KafkaProducer;
-import org.apache.kafka.clients.producer.ProducerRecord;
-import org.apache.kafka.common.serialization.StringSerializer;

 import java.io.IOException;
-import java.text.SimpleDateFormat;
-import java.util.Date;
-import java.util.Properties;
 import java.util.Random;
-import java.util.concurrent.ExecutionException;

 import static java.lang.System.currentTimeMillis;


--- a/src/main/java/com/zorkdata/tools/mock/MockStreamxLogAvro.java
+++ b/src/main/java/com/zorkdata/tools/mock/MockStreamxLogAvro.java
@@ -2,8 +2,6 @@ package com.zorkdata.tools.mock;

 import com.zorkdata.tools.kafka.CommonProducer;
 import com.zorkdata.tools.kafka.CommonProducerPool;
-import com.zorkdata.tools.oldkafka.Producer;
-import com.zorkdata.tools.oldkafka.ProducerPool;
 import com.zorkdata.tools.utils.DateUtil;

 import java.util.HashMap;
@@ -50,7 +48,7 @@ public class MockStreamxLogAvro {

    public static void main(String[] args) throws Exception {
        // long size = 10000000L * 1;
-        long size = 10;
+        long size = 100;
        // String topicName = "log2metric1y";
        String topicName = "test";
        for (int i = 0; i < size; i++) {

--- a/src/main/resources/config.properties
+++ b/src/main/resources/config.properties
@@ -4,5 +4,6 @@ kafka.topic.name=a
 key.serializer=org.apache.kafka.common.serialization.StringSerializer
 value.serializer=org.apache.kafka.common.serialization.ByteArraySerializer
 #value.serializer=org.apache.kafka.common.serialization.StringSerializer
+producer.theard.num=15
 log.size = 10000
 log.topic=flinkx