new chat template for /chat/completions (better system support)

2024-03-25 12:52:40 +08:00 · 2024-03-25 12:52:40 +08:00 · 16f2201d9f
commit 16f2201d9f
parent a93610e574
1 changed files with 56 additions and 16 deletions
--- a/backend-python/routes/completion.py
+++ b/backend-python/routes/completion.py
@ -53,6 +53,9 @@ class ChatCompletionBody(ModelConfigBody):
    assistant_name: Union[str, None] = Field(
        None, description="Internal assistant name", min_length=1
    )
    system_name: Union[str, None] = Field(
        None, description="Internal system name", min_length=1
    )
    presystem: bool = Field(
        True, description="Whether to insert default system prompt at the beginning"
    )
@ -68,6 +71,7 @@ class ChatCompletionBody(ModelConfigBody):
                "stop": None,
                "user_name": None,
                "assistant_name": None,
                "system_name": None,
                "presystem": True,
                "max_tokens": 1000,
                "temperature": 1,
@ -252,20 +256,9 @@ async def eval_rwkv(
                }
-@router.post("/v1/chat/completions", tags=["Completions"])
+def chat_template_old(
-@router.post("/chat/completions", tags=["Completions"])
+    model: TextRWKV, body: ChatCompletionBody, interface: str, user: str, bot: str
-async def chat_completions(body: ChatCompletionBody, request: Request):
+):
    model: TextRWKV = global_var.get(global_var.Model)
    if model is None:
        raise HTTPException(status.HTTP_400_BAD_REQUEST, "model not loaded")
    if body.messages is None or body.messages == []:
        raise HTTPException(status.HTTP_400_BAD_REQUEST, "messages not found")
    interface = model.interface
    user = model.user if body.user_name is None else body.user_name
    bot = model.bot if body.assistant_name is None else body.assistant_name
    is_raven = model.rwkv_type == RWKVType.Raven
    completion_text: str = ""
@ -334,6 +327,53 @@ The following is a coherent verbose detailed conversation between a girl named {
        completion_text += append_message + "\n\n"
    completion_text += f"{bot}{interface}"
    return completion_text
 def chat_template(
    model: TextRWKV, body: ChatCompletionBody, interface: str, user: str, bot: str
 ):
    completion_text: str = ""
    if body.presystem:
        completion_text = (
            f"{user}{interface} hi\n\n{bot}{interface} Hi. "
            + "I am your assistant and I will provide expert full response in full details. Please feel free to ask any question and I will always answer it.\n\n"
        )
    system = "System" if body.system_name is None else body.system_name
    for message in body.messages:
        append_message: str = ""
        if message.role == Role.User:
            append_message = f"{user}{interface} " + message.content
        elif message.role == Role.Assistant:
            append_message = f"{bot}{interface} " + message.content
        elif message.role == Role.System:
            append_message = f"{system}{interface} " + message.content
        completion_text += append_message + "\n\n"
    completion_text += f"{bot}{interface}"
    return completion_text
@router.post("/v1/chat/completions", tags=["Completions"])
@router.post("/chat/completions", tags=["Completions"])
 async def chat_completions(body: ChatCompletionBody, request: Request):
    model: TextRWKV = global_var.get(global_var.Model)
    if model is None:
        raise HTTPException(status.HTTP_400_BAD_REQUEST, "model not loaded")
    if body.messages is None or body.messages == []:
        raise HTTPException(status.HTTP_400_BAD_REQUEST, "messages not found")
    interface = model.interface
    user = model.user if body.user_name is None else body.user_name
    bot = model.bot if body.assistant_name is None else body.assistant_name
    if model.version < 5:
        completion_text = chat_template_old(model, body, interface, user, bot)
    else:
        completion_text = chat_template(model, body, interface, user, bot)
    user_code = model.pipeline.decode([model.pipeline.encode(user)[0]])
    bot_code = model.pipeline.decode([model.pipeline.encode(bot)[0]])
    if type(body.stop) == str:
@ -343,8 +383,8 @@ The following is a coherent verbose detailed conversation between a girl named {
        body.stop.append(f"\n\n{bot_code}")
    elif body.stop is None:
        body.stop = default_stop
-    if not body.presystem:
+    # if not body.presystem:
-        body.stop.append("\n\n")
+    #     body.stop.append("\n\n")
    if body.stream:
        return EventSourceResponse(