webbigdata
/

VoiceCore_gptq

compressed-tensors

Model card Files Files and versions

dahara1 commited on 1 day ago

Commit

48d39ae

·

verified ·

1 Parent(s): 7339bc2

Update README.md

Files changed (1) hide show

README.md +4 -1

README.md CHANGED Viewed

@@ -144,14 +144,17 @@ for i, code_list in enumerate(code_lists):
 ## Streaming sample
 vLLMをサーバーとして動作させてストリーミングでアクセスさせ、クライアントが逐次再生するデモです。
-品質は劣化してしまいますがRTX 4060くらいの性能を元GPUならかなりの高速化がみこめます
 理想は雑音が生成されないタイミングで生成する事ですが、まだ実現出来ておらず、実証実験レベルとお考え下さい
 ### Sever side command
 ```
 python3 -m vllm.entrypoints.openai.api_server --model VoiceCore_gptq --host 0.0.0.0 --port 8000 --max-model-len 9000
 ```
 ### Client side scripyt
 ```
 import torch
 from transformers import AutoTokenizer

 ## Streaming sample
 vLLMをサーバーとして動作させてストリーミングでアクセスさせ、クライアントが逐次再生するデモです。
+品質は劣化してしまいますがRTX 4060くらいの性能をもつGPUなら疑似リアルタイム再生が実現できます。
 理想は雑音が生成されないタイミングで生成する事ですが、まだ実現出来ておらず、実証実験レベルとお考え下さい
 ### Sever side command
+(Linux server前提)
 ```
 python3 -m vllm.entrypoints.openai.api_server --model VoiceCore_gptq --host 0.0.0.0 --port 8000 --max-model-len 9000
 ```
 ### Client side scripyt
+(Windows前提)
+SERVER_URLを書き換えてください
 ```
 import torch
 from transformers import AutoTokenizer