infosys
/

NT-Java-1.1B

Text Generation

NarrowTransformer

text-generation-inference

Inference Endpoints

Model card Files Files and versions

rajabmondal commited on Jun 24, 2024

Commit

9057e2d

·

verified ·

1 Parent(s): 3baf79c

Update README.md

Files changed (1) hide show

README.md +13 -1

README.md CHANGED Viewed

@@ -78,6 +78,8 @@ The model is intended for commercial use for Java programming tasks. The model p
 3. Code generation/Completion task in Java
 4. FIM task in Java
 ### Generation
 ```Java
 # pip install -q transformers
@@ -93,7 +95,17 @@ inputs = tokenizer.encode("public class HelloWorld {\n    public static void mai
 outputs = model.generate(inputs)
 print(tokenizer.decode(outputs[0]))
 ```
-#### Quantized Versions through `bitsandbytes`
 * _Using 8-bit precision (int8)_
 ```java

 3. Code generation/Completion task in Java
 4. FIM task in Java
+## Sample inference code
 ### Generation
 ```Java
 # pip install -q transformers
 outputs = model.generate(inputs)
 print(tokenizer.decode(outputs[0]))
 ```
+### Fill-in-the-middle
+Fill-in-the-middle uses special tokens to identify the prefix/middle/suffix part of the input and output:
+```Java
+input_text = "<fim_prefix>public class PalindromeChecker {\n        public static boolean isPalindrome(String str) {\n          <fim_suffix>return true;\n      }\n<fim_middle>"
+inputs = tokenizer.encode(input_text, return_tensors="pt").to(device)
+outputs = model.generate(inputs)
+print(tokenizer.decode(outputs[0]))
+```
+### Quantized Versions through `bitsandbytes`
 * _Using 8-bit precision (int8)_
 ```java